来源:AINEWS 作者:Muhammad Zulhusni

在阿里云主办的杭州云栖大会上,中国的人工智能初创企业强调了他们在开发大语言模型方面所付出的努力。
这些企业的努力是在 OpenAI 宣布其最新的大语言模型之后展开的,其中包括由微软支持的 o1 生成式预训练变换器模型。该模型旨在处理高难度任务,为科学、编程和数学领域的进步铺平道路。
在大会期间,月之暗面人工智能(Moonshot AI)的创始人库纳尔・志林强调了 o1 模型的重要性,并补充说,它有潜力重塑各个行业,为人工智能初创企业创造新的机遇。
志林表示,强化学习和可扩展性可能是人工智能发展的关键所在。他谈到了规模定律,即拥有更多训练数据的更大模型表现更优。
志林称:“这种方法提高了人工智能能力的上限。” 他还补充说,OpenAI 的 o1 模型有潜力颠覆各个行业,并为初创企业带来新的机会。
OpenAI 也强调了该模型解决复杂问题的能力,称其运作方式类似于人类的思维方式。通过完善自身策略并从错误中学习,该模型提升了自己解决问题的能力。
志林表示,拥有足够计算能力的公司不仅能够在算法方面进行创新,还能在基础人工智能模型上有所突破。他认为这至关重要,因为人工智能工程师在耗尽现有的原始数据源后,越来越依赖强化学习来生成新的数据。
阶乘跳动(StepFun)首席执行官蒋大昕对志林的观点表示赞同,但他指出,计算能力对于许多初创企业来说仍然是一个巨大的挑战,尤其是由于美国的贸易限制阻碍了中国企业获取先进的半导体技术。
蒋大昕表示:“对计算能力的需求仍然很大。”
一位来自百川智能(Baichuan AI)的内部人士称,只有一小部分中国人工智能初创企业 —— 包括月之暗面人工智能、百川智能、智谱 AI(Zhipu AI)和迷你_max(MiniMax)—— 有能力在强化学习方面进行大规模投资。这些企业 —— 被统称为 “AI 小虎队”—— 深度参与大语言模型的开发,推动着下一代人工智能的发展。
云栖大会的更多消息
同样在此次大会上,阿里云发布了多项消息,包括推出其通义千问 2.5(Qwen 2.5)模型家族,该模型在编程和数学方面取得了进展。这些模型的参数数量从 5 亿到 720 亿不等,支持约 29 种语言,包括中文、英文、法文和西班牙文。
像通义千问 2.5 – 代码(Qwen2.5-Coder)和通义千问 2.5 – 数学(Qwen2.5-Math)这样的专业模型已经获得了一定的关注,在 Hugging Face 和魔搭(ModelScope)等平台上的下载量已超过 4000 万次。
阿里云丰富了其产品组合,在其图像生成器通义万象中推出了一个文本转视频模型。该模型能够生成写实风格和动画风格的视频,可应用于广告和电影制作等领域。
阿里云推出了通义千问 2 – 视觉语言(Qwen 2-VL)模型,这是其视觉语言模型的最新版本。它能够处理时长超过 20 分钟的视频,支持基于视频的问答功能,并且针对移动设备和机器人进行了优化。
本文转载自AINEWS,本文观点不代表雅典娜AI助手YadiannaAI立场。