来源:CIO 作者:Kurt Muehmel

生成式人工智能(GenAI)解决方案的第一波浪潮已经在企业中取得了相当大的成功,尤其是在代码辅助工具领域以及提高现有软件即服务(SaaS)产品的效率方面。然而,这些应用仅仅展示了大语言模型(LLM)潜力的一小部分。这项技术的真正实力如今正体现在第二代人工智能驱动的应用程序中:基于智能体的系统,它们建立在大语言模型的坚实基础之上,并将其能力提升到了一个新的水平。
与传统的人工智能聊天机器人或简单的 SaaS 产品辅助工具不同,人工智能智能体充分利用了大语言模型的全部能力。它们不仅能够生成文本,还能(几乎)独立解决复杂问题。人工智能智能体是一个由大语言模型驱动的系统,它在既定的自主范围内追求特定目标,并使用各种工具。
一个例子可以说明其可能性:设想一个大语言模型接收到了一个可以检索当前股票价格的应用程序编程接口(API)的文档。有了这些信息,该大语言模型就能独立创建一个脚本,调用这个 API 来获取特定股票的价格。如果允许该系统执行这个脚本,它就会成为终端用户检索任意股票价格的工具。
智能体很少单独行动
那么,有没有可能开发出一个单一的、功能全面的应用程序,来解决一家公司的所有问题呢?简短的答案是不能。尽管大语言模型具有泛化能力,但企业环境的限制要求每个单独的应用程序的适用范围相对较窄。只有这样,公司才能确保稳定的性能,并控制对数据和工具的访问。
这个想象中的 “超级应用程序” 听起来很方便,但它需要能够完全访问公司的所有数据和工具,从最普通的到最敏感的都包括在内。就像员工应该只能访问其工作所需的数据和工具一样,基于智能体的应用程序的访问权限也必须限制在执行其功能所需的范围内。
一家大型公司可能需要多少个这样的人工智能智能体呢?一个粗略的估计:一家有十个部门、每个部门有五项核心职能的大型公司,每个职能若配备五个专门的应用程序可能会从中受益。例如,销售部门在销售运营方面可以使用一个智能体来:
研究目标客户
核实销售流程是否合规
分析销售渠道
总结客户会议内容
支持后续跟进活动
这样算下来总共就需要 250 个应用程序 —— 对于大型组织来说,这是一个现实的预测。
开发构建还是购买?
市面上有数百种新的应用程序可供选择,公司面临着 “构建还是购买” 的决策。软件供应商已经将相应的应用程序推向市场。与此同时,一些先进的组织正在内部开发他们首批可投入生产的基于智能体的应用程序。
现成的人工智能智能体具有决定性的优势:一旦实施,它们就能提供现成可用的性能,由专业软件开发人员提供支持,并能实现快速部署。然而,这类现成的人工智能智能体也存在一些缺点,比如常常难以复杂地集成到现有的企业系统中,在追踪所使用的模型方面存在管理问题,而且最后但同样重要的是,拥有相同解决方案的竞争对手也能实现同样的性能。
另一方面,自行开发的定制化人工智能智能体可以精确地适应特定的业务环境,从而有可能在市场上实现真正的差异化。公司对自己的应用程序拥有完全的控制权和透明度,并且可以摆脱对外部软件、人工智能和云服务提供商的依赖。然而,这些优势也伴随着自身的挑战:许多组织并不具备足够的必要开发技能,而且随着自行开发的应用程序数量的增加,监控和维护的复杂性也会显著提高。
因此,大多数公司会购买一些应用程序,同时自行开发其他一些应用程序。需要注意的是,虽然人工智能智能体可以提高运营流程的效率,但如果这些效率提升与竞争对手的提升速度相当,那么公司的竞争地位并不会得到改善。
另一方面,开发定制的、基于智能体的应用程序,能使公司创造出竞争对手所没有的能力。考虑到其中涉及的成本和复杂性,公司会将内部开发工作集中在那些从强大的竞争差异化中获益最多的业务部分,通常是其核心业务。
突破复杂性阈值
每个组织都有一个最大数量限制,即使用当前的实践方法,能够开发、监控和维护的应用程序数量。这就是该组织的 “复杂性阈值”。
随着公司开发越来越多基于智能体的应用程序,监控和维护这些程序的复杂性也会增加,直到在某个时刻达到最大复杂性,无法再开发更多的应用程序 —— 即使开发更多应用程序会对业务有益。
公司必须找到一种方法来提高其复杂性阈值,以便开发更多的应用程序。这就需要对这些应用程序的开发进行标准化和结构化。
基于智能体的应用程序的新架构范式
多年来,组织使用过各种架构范式,从单体应用程序到面向服务的架构,再到微服务架构。如今,用于构建基于智能体的应用程序的基础设施大多是单体的,并且使用诸如 LangChain 这样的框架。虽然这种方法适用于开发初始原型,但它反映了在企业环境中基于智能体的应用程序设计相对不成熟的现状。
因此,需要一种新的架构范式来创建和维护大量基于智能体的应用程序。一种实现方式是为大语言模型以及在企业中创建智能体所需的相关组件采用网状架构。它提供了抽象层,将不同的组件分组为统一的对象类型。
这样的多层架构可能包括以下组件:
基础模型:经过训练的人工智能模型及其基本的数学权重。
数据层:分为非结构化数据和结构化数据。
服务层:包括模型运行所需的服务以及数据访问服务。
编排层:在这里将提示词、智能体和工具整合在一起。
应用层:带有用户界面的可用应用程序。
这种架构的关键优势在于抽象性:它在不同的层之间创建了标准化的接口,使得可以在无需调整其他组件的情况下替换单个服务。这种解耦使公司能够提高其复杂性阈值。
库尔特・米勒梅尔(Kurt Muehmel)是 Dataiku 公司的人工智能战略主管。他是一位兼具创造力和分析能力的高管,拥有超过 15 年的从业经验,在企业人工智能领域拥有深厚的专业知识,更广泛地说,在企业对企业(B2B)的软件即服务(SaaS)的市场推广战略和策略方面也有丰富的经验。
本文转载自CIO,本文观点不代表雅典娜AI助手YadiannaAI立场。