来源:天空之城

随着OpenAI、Google、XAI及DeepSeek等平台推出可用的AI代理,一个新的竞争者Manus也已登场,这个全新的代理式AI平台在全球引发关注。Manus作为首个通用AI代理的早期预览版已经发布,并迅速激起热议,被部分人视为中国继DeepSeek后的又一重要时刻,称赞其为体验过最令人印象深刻的AI工具和最先进的AI计算机使用方式。与前辈不同,Manus并非仅是专业的聊天机器人,而是致力于成为真正的通用AI代理,但其访问受限,其实际变革能力仍待观察。
Manus的核心创新在于其多智能体人工智能系统,该系统能处理从旅行规划、财务分析到文件搜索和行业研究等多样化任务。其运作方式并非依赖单一大型神经网络,而是像一位执行官,协调一个由规划智能体、多个专业子智能体(负责知识、记忆、执行等)组成的团队。系统首先分解用户任务为子任务,规划执行路径,然后分配给相应的子智能体。这些子智能体共享上下文,各自拥有专业领域,并能调用包含29种集成工具的广泛工具集,智能决策使用何种工具完成网页导航、代码运行或信息提取等任务。最后,执行者代理整合所有子任务的输出,生成最终结果。
该系统由复杂的动态任务分解算法驱动,能自主拆解复杂指令。为保证稳定性,Manus团队研发了“思维链注入”技术,使代理能主动反思和更新计划。其核心模型采用了Anthropic的Claude 3.7 Sonnet,并无缝集成了YC Company浏览器等开源工具及Startup E2B的安全云沙盒环境,具备强大的跨平台执行能力。Manus擅长创建旅行行程、财务分析、教育内容,以及处理结构化数据库编译、保险比较、供应商筛选和演示文稿制作等实际任务。在衡量AI代理推理、多模态处理、网页浏览和工具使用的Gaia基准测试中,Manus得分高达86.5%,超越了OpenAI研究平台的74%,接近人类平均水平的92%。
尽管表现亮眼,Manus也引发了关于应用层AI初创公司实质上是否为“封装器”的讨论。批评者认为Manus只是将现有基础模型与工具调用拼接起来。然而,这种观点忽视了许多成功的AI产品(如Cursor、Windsurf、Harvey)也采用了类似模式,通过集成现有LLM、API和特定领域工具来创造价值。成功的封装器通常通过直观UI、专有评估、精细微调和精心设计的多智能体架构脱颖而出。Manus联合创始人亦表示,他们选择与模型开发正交的路径,乐见新模型的发布。
Manus的多智能体编排带来了成本优势(每任务约2美元,低于某些集成竞争对手),并提供了更高的透明度和用户控制,允许用户检查、定制甚至替换子智能体和工具。其暴露文件系统的特性让用户能直观了解代理工作过程,预示了未来桌面AI应用的潜力。然而,其局限性也存在,如任务复杂时跨代理协调难度增加,且其当前的优势(用户体验、微调、集成)易被模仿。封装器模式虽能快速部署和迭代,但也易受API定价或供应商政策变化的影响。最终,关键挑战并非封装器模式是否可行,而是如何为产品建立可持续的差异化,例如通过投资难以复制的专有评估、深度嵌入用户工作流或集成独特平台与数据集。归根结底,AI领域的成功往往不取决于重新发明基础模型,而在于谁能将现有模型有效整合,创造出用户真正喜爱的产品。
视频和全文链接:
本文转载自天空之城,本文观点不代表雅典娜AI助手YadiannaAI立场。