企业IT负责人在小型人工智能模型中捕捉到巨大商业潜力

来源:CIO 作者:Paula Rooney

企业IT负责人在小型人工智能模型中捕捉到巨大商业潜力

小型语言模型(SLM)更适合开发针对特定业务的人工智能应用程序,由于其具有敏捷、成本效益高以及任务针对性强的特点,在企业中的使用量可能很快就会超过大型语言模型(LLM)。

小型语言模型(SLM)为首席信息官(CIO)提供了更多机会,来开发专门针对特定业务的人工智能应用程序,与依赖通用大型语言模型(LLM)的应用程序相比,这些应用程序的运行成本更低。

根据高德纳咨询公司(Gartner)最近的一份报告,到 2027 年,规模更小、针对特定情境的模型的使用量将超过大型语言模型,至少是后者的三倍。该报告还指出,对于需要特定业务情境的任务,大型语言模型的回复准确性会下降。

协助撰写该报告的高德纳分析师苏米特・阿加瓦尔(Sumit Agarwal)表示:“业务工作流程中任务的多样性,以及对更高准确性的需求,正推动着向针对特定功能或领域数据进行微调的专业模型转变。这些更小、针对特定任务的模型能够提供更快速的回复,并且使用更少的计算能力,从而降低了运营和维护成本。”

印度威普罗公司(Wipro)的技术人员马格什・卡斯图里(Magesh Kasthuri)博士表示,他并不认为大型语言模型比小型语言模型更容易出错,但他也认同大型语言模型产生幻觉(生成错误或无意义信息)的问题值得关注。卡斯图里说:“对于银行或能源等以领域为中心的解决方案来说,小型语言模型是实现敏捷性、资源成本效益、快速原型开发,以及保护组织数据安全和隐私的可行途径。”

尽管像 OpenAI、Gemini、Claude 和 Grok 等执行广泛功能的通用大型语言模型备受关注,但越来越多的小型专业模型正作为针对特定任务应用的经济高效替代品涌现出来,其中包括 Meta 的 Llama 3.1、微软的 Phi,以及谷歌的 Gemma 小型语言模型。

例如,谷歌声称其最近推出的 Gemma 3 小型语言模型仅需一个英伟达(Nvidia)的图形处理器(GPU)就能运行。

小型语言模型吸引企业目光

艾利丹尼森公司(Avery Dennison)的首席信息官尼古拉斯・科利斯托(Nicholas Colisto)认为,智能体人工智能的兴起是如今首席信息官们对小型语言模型兴趣大增的原因之一。

科利斯托表示:“为生成式人工智能和智能体人工智能应用选择合适的基础模型,是如今首席信息官和首席人工智能官(CAIO)面临的较为复杂的决策之一。这不仅仅关乎性能基准,还涉及到平衡成本、安全性、可解释性、可扩展性以及实现价值所需的时间。现在的趋势正从大型通用模型转向更小、针对特定领域的模型,这些模型能更好地满足行业需求,同时降低风险和成本。”

高德纳坚持认为,小型语言模型能增强对敏感业务数据的控制,同时降低运营成本,并提高在特定领域的性能。高德纳称,这种更具针对性的人工智能应用方法 —— 用于客户服务自动化、市场趋势分析、产品创新和情感分析 —— 还能带来隐私和版权保护方面的益处。

IBM 旗下公司 Hakkoda 的首席创新官帕特里克・布尔(Patrick Buell)表示:“这完全正确。经过微调的开源小型语言模型在防火墙后运行,解决了许多安全、治理和成本方面的担忧。”

英特尔根公司(Intelagen)的创始人汤姆・里彻(Tom Richer)曾担任首席信息官,该公司是谷歌的合作伙伴,专门开发和部署针对特定垂直领域的人工智能解决方案。里彻表示,高德纳的报告与他在该领域的所见所闻相符。

里彻说:“通用大型语言模型有其存在的价值,但对于特定的业务问题,更小、经过微调的模型能以更高的效率提供更好的结果,在受监管的行业中尤其如此。转向小型语言模型的主要驱动因素是大型语言模型产生幻觉的风险。通用大型语言模型在处理特定或微妙的业务情境时,往往会生成不准确或无意义的信息,这是一个重大障碍。”

里彻补充道:“对于准确性和可靠性至关重要的企业应用来说,在许多情况下,这种内在风险使得仅仅依赖通用大型语言模型根本不可行。这就是为什么更具针对性、专业性的方法往往是更谨慎可靠的解决方案的根本原因。在医疗保健的应用场景中,可不能冒着出现幻觉的风险。”

充满变化的未来

去年秋天,微软宣布利用其 Phi 系列小型语言模型调整人工智能模型,以扩展其行业能力,使企业能够更准确有效地满足定制化需求。该公司宣布正在开发经过微调的模型,这些模型利用特定行业数据进行预训练,适用于与企业合作伙伴拜耳(Bayer)、罗克韦尔自动化公司(Rockwell Automation)、西门子数字工业软件公司(Siemens Digital Industries Software)等共同确定的常见业务场景。

微软首席执行官萨蒂亚・纳德拉(Satya Nadella)最近称赞了一家大型航空公司开发的一款小型语言模型,他在东京的一次演示中看到了该模型的应用。纳德拉在领英(LinkedIn)上发布消息称:“借助我们的 Phi 小型语言模型,日本航空公司(Japan Airlines)的空乘人员花在文书工作上的时间减少了,能有更多时间服务乘客。”

微软还称,其开发的 Orca 和 Orca 2 展示了如何利用合成数据对小型语言模型进行训练后优化,使其在特定任务上表现更出色。

基于 Gemini 2.0 的谷歌 Gemma 3,是一系列轻量级、最先进的开源模型,旨在能够在从手机、笔记本电脑到工作站等设备上直接快速运行。谷歌在发给首席信息官(CIO)的一份声明中称:“Gemma 小型语言模型利用特定业务领域的智能,而非宽泛的通用性,并且是为医疗保健、法律和金融等行业量身定制的,在各自领域的表现优于大型语言模型。”

高德纳表示,企业可以通过采用检索增强生成(RAG)或其他微调技术,对大型语言模型进行定制,以用于特定任务,从而创建专业模型。但认知技术公司(Cognizant)的副总裁兼人工智能与分析全球负责人纳文・沙玛(Naveen Sharma)称,高德纳关于小型语言模型在两年内使用量超过大型语言模型的预测,体现了整个行业的一个加速趋势,即让人工智能更具任务针对性,并符合治理和监管合规要求。

沙玛说:“随着各组织寻求更有效地扩展人工智能应用,事实证明,更小、针对特定任务的模型运行速度更快、效率更高,并且更容易集成到实际业务工作流程中。说到人工智能模型,小的可能更智能,但未来并非二选一:而是进行统筹协调,大型模型提供基础,更小、目标明确的模型满足精确的业务需求。”

沙玛还表示,小型语言模型开发的增加并不意味着大型基础模型会消失。

沙玛补充道:“如果说有什么变化的话,它们的作用正变得更具战略性。它们不再是最终产品,而是成为了起点 —— 提供核心能力,团队可以在此基础上进行构建、调整,并针对特定用例进行微调。我们正从将它们用作通用工具,转变为将它们用作更定制化、更高效的人工智能系统的核心基础设施,从而更好地为业务服务。”

本文转载自CIO,本文观点不代表雅典娜AI助手YadiannaAI立场。

(0)
Athena的头像Athena
上一篇 21小时前
下一篇 21小时前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

客服邮箱: kefu@yadiannaai.com

投稿邮箱:tougao@yadiannaai.com

合作邮箱:hezuo@yadiannaai.com

关注微信