Meta 将把 Llama 人工智能模型作为应用程序编程接口(API)提供

来源:InfoWorld 作者:Gyana Swain

Meta 将把 Llama 人工智能模型作为应用程序编程接口(API)提供

企业将能够访问由 Meta 托管的 Llama 模型,而无需自行下载和运行这些模型。

Meta 推出了其 Llama 大型语言模型 API 的预览版本。这项新服务将把 Meta 广受欢迎的开源模型转变为一项适用于企业的服务,这直接对 OpenAI 等已占据市场的企业构成了挑战,同时也解决了企业采用者的一个关键担忧:避免被供应商锁定。

Meta 在其首届 LlamaCon 开发者论坛上发表声明称:“我们希望让您能更轻松地快速开始使用 Llama 进行开发,同时让您能完全掌控自己的模型和权重,而不会被局限于某一个 API。”

Llama API 标志着 Meta 从单纯发布开源模型向提供各种基于云的人工智能基础设施的转变。
灰狗研究公司(Greyhound Research)首席分析师桑奇特・维尔・戈吉亚(Sanchit Vir Gogia)表示:“他们正将竞争领域从单纯的模型质量转移到推理成本、开放性和硬件优势上。”

OpenAI 软件开发工具包(SDK)兼容性

该公司称,这项新服务将提供一键式 API 密钥创建功能、交互式模型试用环境,并能让用户立即访问 Meta 最新的 Llama 4 Scout 和 Llama 4 Maverick 模型。

通过 Python 和 TypeScript 的轻量级软件开发工具包,与现有基础设施的集成非常简便。Meta 保持了与 OpenAI 软件开发工具包的兼容性,使得开发者只需对代码进行少量修改,就能转换现有的应用程序。
该解决方案包括用于微调与评估的工具,使开发者能够创建新的 Llama 3.3 8B 模型的定制版本,这有可能在特定的应用场景中降低成本,同时提高性能。

芯片合作

Meta 将与人工智能芯片制造商赛乐博思(Cerebras)和格罗克(Groq)合作,以提高推理速度,这是生产级人工智能应用中的一个关键因素。

赛乐博思以其专门的人工智能芯片而闻名,该公司承诺其芯片的性能将比传统的图形处理器(GPU)解决方案快得多。根据该公司引用的第三方基准测试,Llama 4 Scout 在其芯片上的运行速度超过每秒 2600 个标记,而 OpenAI 的 ChatGPT 运行速度约为每秒 130 个标记。
赛乐博思首席执行官安德鲁・费尔德曼(Andrew Feldman)表示:“开发智能体和实时应用程序的开发者需要速度。有了赛乐博思为 Llama API 提供支持,他们可以构建出领先的基于 GPU 的推理云根本无法实现的人工智能系统。”
同样,格罗克的语言处理单元(LPU)芯片的运行速度高达每秒 625 个标记。格罗克首席执行官乔纳森・罗斯(Jonathan Ross)强调,他们的解决方案 “为推理这一任务进行了垂直整合”,每一层都 “经过精心设计,以在不牺牲任何性能的情况下实现稳定的速度和成本效益”。
Counterpoint Research 的研究副总裁兼合伙人尼尔・沙阿(Neil Shah)表示:“通过采用像 Llama API 这样的前沿且‘开放’的解决方案,企业开发者现在有了更好的选择,无需在速度和效率上做出妥协,也不必被专有模型所束缚。”
灰狗公司的戈吉亚称,Meta 与格罗克和赛乐博思的战略合作以支持 Llama 人工智能,“标志着大型语言模型即服务市场的一个决定性转变”。

利用企业对专有人工智能的顾虑

Llama API 进入的这个市场中,OpenAI 的 GPT 模型已早早占据了主导地位,但 Meta 正利用其关键优势来吸引那些对专有人工智能基础设施仍持犹豫态度的企业客户。
戈吉亚指出:“Meta 的 Llama API 为企业人工智能开发者提出了一个截然不同的方案,它不仅仅是一个工具,更是一种理念的转变。与 OpenAI 或 Anthropic 的专有 API 不同,后者将开发者束缚在不透明的定价、封闭的权重和有限的使用权中,而 Llama 提供了开放性、模块化,以及选择自己的推理堆栈的自由。”
Meta 明确承诺保护数据隐私,称其不会使用提示或模型回复来训练其人工智能模型,这直接回应了企业对其他供应商使用客户数据来改进其系统的担忧。此外,其数据可移植性保证确保了在 Llama API 上构建的模型不会被锁定在其服务器上,企业可以将模型迁移并托管到任何他们希望的地方。
这种方法创造了一个独特的中间地带:既具备企业级的便利性,又拥有完全拥有模型所有权的最终退出策略。

市场影响及未来计划

目前,Llama API 以有限的免费预览版形式提供,计划在 “未来几周或几个月内” 扩大访问范围,这使得 Meta 成为 OpenAI、微软和谷歌的直接竞争对手。该公司将此次发布描述为 “第一步”,预计在 2025 年全年还会推出更多企业级功能。
赛博传媒研究公司(CyberMedia Research)行业研究团队副总裁普拉布・拉姆(Prabhu Ram)称,Meta 的 Llama API 是现有大型语言模型即服务产品中更快速、更开放且更具模块化的选择。“然而,在生态系统集成和成熟的企业工具方面,它仍落后于 OpenAI 和谷歌等专有平台。”

对于渴望测试这些性能宣称的技术团队来说,只需在 API 界面中进行简单选择,就能访问由赛乐博思和格罗克支持的 Llama 4 模型。

行业分析师认为,Meta 的加入可能会加速人工智能 API 市场的价格竞争,同时提高推理性能的标准。对于开发面向客户的人工智能应用程序的企业来说,性能的提升可能会催生新的应用类别,而在这些应用中,响应时间至关重要。
拉姆总结道:“Meta 的长期影响将取决于它能否有效地缩小生态系统差距,并在其开源模型堆栈的基础上提供企业级解决方案。”

本文转载自InfoWorld,本文观点不代表雅典娜AI助手YadiannaAI立场。

(0)
Athena的头像Athena
上一篇 2025年5月2日 上午6:52
下一篇 2025年5月2日 下午6:34

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

客服邮箱: kefu@yadiannaai.com

投稿邮箱:tougao@yadiannaai.com

合作邮箱:hezuo@yadiannaai.com

关注微信