谷歌 Gemini在一点帮助下通关了《精灵宝可梦蓝》

Athena • 文章来源: TechCrunch • 2025年5月4日下午10:36 • AI热点要闻 • 阅读 52

来源：TechCrunch 作者：Anthony Ha

谷歌最昂贵的人工智能模型似乎已经跨越了一个重要的里程碑：通关了一款已有 29 年历史的电子游戏。

昨晚，谷歌首席执行官桑达尔・皮查伊（Sundar Pichai）在 X 平台上得意地发文称：“多么精彩的结局！Gemini 2.5 Pro 刚刚通关了《精灵宝可梦蓝》！”

需要说明的是，“Gemini 玩宝可梦” 直播是由一位（用他自己的话说）“与谷歌无关的 30 岁软件工程师” 乔尔・Z（Joel Z）发起的。不过谷歌的高管们一直在为这一尝试加油助威。

例如，谷歌人工智能工作室的产品负责人洛根・基尔帕特里克（Logan Kilpatrick）上个月发文称，Gemini 在 “通关《精灵宝可梦》” 方面 “取得了很大进展”，并且 “已经获得了第五枚徽章（目前表现第二好的模型只有 3 枚徽章，不过使用的是不同的智能体工具）”，这引得皮查伊打趣道：“我们正在研究应用程序编程接口，也就是人工宝可梦智能呢：）”

为什么是《精灵宝可梦》呢？今年 2 月，人工智能公司 Anthropic 强调了其 Claude 人工智能模型在玩《精灵宝可梦红》时取得的进展，称 Claude 的 “扩展思维和智能体训练” 使其在诸如玩经典游戏这类 “更出乎意料” 的任务上 “有了很大提升”。（《精灵宝可梦红》和《精灵宝可梦蓝》是 1996 年首次发布的一款 GameBoy 游戏的不同版本，与长期运营的《精灵宝可梦》系列相关）。甚至还有一个名为 “Claude 玩宝可梦” 的 Twitch 频道，乔尔・Z 称这个频道给他带来了灵感。

尽管 Claude 取得了一些进展，但它似乎还没有通关《精灵宝可梦红》。这是否意味着 Gemini 在这款游戏上客观上表现更好呢？乔尔・Z 在他的 Twitch 页面上敦促观众：“请不要把这当作衡量一个大型语言模型玩《精灵宝可梦》水平的基准。你无法进行真正直接的比较 ——Gemini 和 Claude 使用的工具不同，获取的信息也不同。”

而且这两个人工智能模型都需要借助外力才能玩这款游戏 —— 这就是前面提到的智能体工具发挥作用的地方。这些工具会为模型提供带有额外信息的游戏截图，让模型决定如何回应（这可能需要调用专门的智能体），然后按下与人工智能指令对应的按钮。

乔尔・Z 承认，为了帮助 Gemini 通关游戏，存在一些其他的 “开发者干预” 行为，但他坚称这不算作弊。

他说：“我的干预提升了 Gemini 的整体决策和推理能力。我没有给出具体的提示 —— 对于像月之山这类特定挑战，没有攻略或直接的指导。唯一有点接近的情况是，我让 Gemini 知道它需要和一个火箭队成员交谈两次才能拿到电梯钥匙，不过这是一个后来在《精灵宝可梦黄》中修复了的漏洞。”

此外，他还表示：“‘Gemini 玩宝可梦’ 仍在积极开发中，其框架也在不断完善。”

本文转载自TechCrunch，本文观点不代表雅典娜AI助手YadiannaAI立场。

谷歌 Gemini在一点帮助下通关了《精灵宝可梦蓝》

发表回复

联系我们

谷歌 Gemini在一点帮助下通关了《精灵宝可梦蓝》

相关推荐

亚马逊、Meta、优步、Anthropic 等公司对美国人工智能行动计划的期望

为什么研究人员关心小型语言模型？

Kimi 开放平台模型推理服务降价

微软推出被称为新的AI屏幕截图工具

AI生成”芭比风”人偶热潮暗藏危机：隐私泄露与版权风险双重预警

OpenAI GPT-4.1模型承诺改进编码和指令

发表回复

联系我们