来源：天空之城

随着OpenAI、Google、XAI及DeepSeek等平台推出可用的AI代理，一个新的竞争者Manus也已登场，这个全新的代理式AI平台在全球引发关注。Manus作为首个通用AI代理的早期预览版已经发布，并迅速激起热议，被部分人视为中国继DeepSeek后的又一重要时刻，称赞其为体验过最令人印象深刻的AI工具和最先进的AI计算机使用方式。与前辈不同，Manus并非仅是专业的聊天机器人，而是致力于成为真正的通用AI代理，但其访问受限，其实际变革能力仍待观察。

Manus的核心创新在于其多智能体人工智能系统，该系统能处理从旅行规划、财务分析到文件搜索和行业研究等多样化任务。其运作方式并非依赖单一大型神经网络，而是像一位执行官，协调一个由规划智能体、多个专业子智能体（负责知识、记忆、执行等）组成的团队。系统首先分解用户任务为子任务，规划执行路径，然后分配给相应的子智能体。这些子智能体共享上下文，各自拥有专业领域，并能调用包含29种集成工具的广泛工具集，智能决策使用何种工具完成网页导航、代码运行或信息提取等任务。最后，执行者代理整合所有子任务的输出，生成最终结果。

该系统由复杂的动态任务分解算法驱动，能自主拆解复杂指令。为保证稳定性，Manus团队研发了“思维链注入”技术，使代理能主动反思和更新计划。其核心模型采用了Anthropic的Claude 3.7 Sonnet，并无缝集成了YC Company浏览器等开源工具及Startup E2B的安全云沙盒环境，具备强大的跨平台执行能力。Manus擅长创建旅行行程、财务分析、教育内容，以及处理结构化数据库编译、保险比较、供应商筛选和演示文稿制作等实际任务。在衡量AI代理推理、多模态处理、网页浏览和工具使用的Gaia基准测试中，Manus得分高达86.5%，超越了OpenAI研究平台的74%，接近人类平均水平的92%。

尽管表现亮眼，Manus也引发了关于应用层AI初创公司实质上是否为“封装器”的讨论。批评者认为Manus只是将现有基础模型与工具调用拼接起来。然而，这种观点忽视了许多成功的AI产品（如Cursor、Windsurf、Harvey）也采用了类似模式，通过集成现有LLM、API和特定领域工具来创造价值。成功的封装器通常通过直观UI、专有评估、精细微调和精心设计的多智能体架构脱颖而出。Manus联合创始人亦表示，他们选择与模型开发正交的路径，乐见新模型的发布。

Manus的多智能体编排带来了成本优势（每任务约2美元，低于某些集成竞争对手），并提供了更高的透明度和用户控制，允许用户检查、定制甚至替换子智能体和工具。其暴露文件系统的特性让用户能直观了解代理工作过程，预示了未来桌面AI应用的潜力。然而，其局限性也存在，如任务复杂时跨代理协调难度增加，且其当前的优势（用户体验、微调、集成）易被模仿。封装器模式虽能快速部署和迭代，但也易受API定价或供应商政策变化的影响。最终，关键挑战并非封装器模式是否可行，而是如何为产品建立可持续的差异化，例如通过投资难以复制的专有评估、深度嵌入用户工作流或集成独特平台与数据集。归根结底，AI领域的成功往往不取决于重新发明基础模型，而在于谁能将现有模型有效整合，创造出用户真正喜爱的产品。

视频和全文链接:

本文转载自天空之城，本文观点不代表雅典娜AI助手YadiannaAI立场。