来源:arstechnica 作者:BENJ EDWARDS

周四,人工智能公司 Anthropic 宣布对其人工智能助手 Claude 进行重大升级,扩展了它的研究能力,使其在生成全面报告前最长可运行 45 分钟。该公司还拓展了集成选项,让 Claude 能够与流行的第三方服务建立连接。
与谷歌于 12 月 11 日推出的深度研究功能(Deep Research)以及 ChatGPT 在 2 月 2 日推出的深度研究功能类似,Anthropic 在 4 月 15 日推出了自家的 “研究” 功能。这些功能都能自主浏览网页和其他在线资源,以文档格式汇编研究报告,而且这种技术的开源仿制品也已问世。
如今,Anthropic 正将其 “研究” 功能向前推进一步。该公司表示,升级后的模式使 Claude 能够通过 “数百个内部和外部资源” 进行 “更深入” 的调查。当用户开启 “研究” 按钮时,Claude 会将复杂的请求分解为较小的部分,对每一部分进行审查,并生成一份带有指向原始来源引用的报告。
根据我们的经验,不同人工智能供应商的这些深度研究功能大多运行得相当不错,能找出一些相关研究内容,如果你事先不知道从哪里查找,这些内容可能很难找到。但用户应该注意结果中可能存在的虚构信息,结果中可能包含一些听起来合理但实际上是人工智能编造出来的、并不存在的来源。
一个简单的测试
Anthropic 称,虽然大多数报告能在 5 到 15 分钟内完成,但对于特别复杂的调查,新的研究系统现在最长可能需要 45 分钟,而这类任务通常需要耗费数小时的人工研究精力。
我们可以证明,由人工智能生成的研究文档在收集重要且值得关注的资料来源方面确实能节省一些时间。但你必须清楚自己在看什么,以确保不依赖于不相关或错误的信息。和往常对待人工智能输出的内容一样,不要盲目相信其中任何信息。从这个意义上说,到目前为止,人工智能搜索功能对特定领域的专家来说可能最为有用,因为他们能够区分好坏信息。
例如,我们向 Anthropic 的 “研究” 功能提出一个简单的问题:“谁发明了电子游戏?” 在经过 13 分 2 秒的研究后,它生成了一份相当全面且细致的报告,还附有资料来源。以我(在过去 20 年里写过很多关于这个主题的内容)的观点来看,这份报告提供了一个在很大程度上准确的历史概述,其质量超过了如今大多数已出版的电子游戏历史书籍。
不过,报告中包含了一段威廉・希金博特姆(William Higinbotham)的直接引述,这段引述似乎是结合了两个未在资料来源列表中引用的来源的内容。(在处理人工智能生成的引述时必须始终小心,因为即使不在这个 “研究” 模式下,Claude 3.7 Sonnet 也常常会编造一些看似合理的引述来符合某种叙述。)我们最近报道了一项研究,该研究显示人工智能搜索服务经常会虚构资料来源,在这种情况下,Claude “研究” 功能找出的资料来源虽然是真实存在的,但似乎并不总是与报告中陈述的内容相符。
当然,在细节方面总是存在解释和差异的空间,但总体而言,Claude “研究” 功能在撰写关于这个特定主题的报告方面做得相对不错。不过,如果你要将其作为严肃研究的基础,你还是需要更深入地挖掘每个资料来源并确认所有内容。你可以阅读 Claude 生成的完整结果,它是一个以 Markdown 格式保存的文本文件。遗憾的是,Markdown 版本中不包含 Claude 网页界面中找到的资料来源网址。
集成功能
Anthropic 在周四还宣布,它拓宽了 Claude 的数据访问能力。除了网页搜索和与谷歌工作空间(Google Workspace)的集成外,现在 Claude 还可以通过该公司新推出的 “集成” 功能搜索任何已连接的应用程序。这个功能在某种程度上让我们想起了 OpenAI 在 2023 年 3 月推出的 ChatGPT 插件功能,后者也旨在实现类似的连接,尽管这两个功能的底层工作方式有所不同。
这些 “集成” 功能使 Claude 能够通过网页和桌面应用程序与远程模型上下文协议(MCP)服务器协同工作。MCP 标准是 Anthropic 在去年 11 月推出的,我们在 4 月曾报道过,它将人工智能应用程序与外部工具和数据源连接起来。
在推出时,Claude 支持与 10 种服务进行集成,包括 Atlassian 公司的 Jira 和 Confluence、Zapier、Cloudflare、Intercom、Asana、Square、Sentry、PayPal、Linear 和 Plaid。该公司计划未来添加更多合作伙伴,如 Stripe 和 GitLab。
每次集成都旨在以特定方式扩展 Claude 的功能。例如,据报道,与 Zapier 的集成通过预先构建的自动化序列连接了数千个应用程序,使 Claude 能够自动从 HubSpot 中提取销售数据,或根据日历条目准备会议简报。Anthropic 表示,通过 Atlassian 的工具,Claude 可以在产品开发方面进行协作、管理任务,并同时创建多个 Confluence 页面和 Jira 工作项。
Anthropic 已向订阅 Max、团队版和企业版计划的用户提供其高级 “研究” 和 “集成” 功能的测试版,专业版(Pro)计划用户也即将能够使用。该公司还将其(于 3 月推出的)网页搜索功能扩展到了全球所有订阅付费计划的 Claude 用户。
本文转载自arstechnica,本文观点不代表雅典娜AI助手YadiannaAI立场。