谷歌 Gemini在一点帮助下通关了《精灵宝可梦蓝》

来源:TechCrunch 作者:Anthony Ha

谷歌 Gemini在一点帮助下通关了《精灵宝可梦蓝》

谷歌最昂贵的人工智能模型似乎已经跨越了一个重要的里程碑:通关了一款已有 29 年历史的电子游戏。

昨晚,谷歌首席执行官桑达尔・皮查伊(Sundar Pichai)在 X 平台上得意地发文称:“多么精彩的结局!Gemini 2.5 Pro 刚刚通关了《精灵宝可梦蓝》!”

需要说明的是,“Gemini 玩宝可梦” 直播是由一位(用他自己的话说)“与谷歌无关的 30 岁软件工程师” 乔尔・Z(Joel Z)发起的。不过谷歌的高管们一直在为这一尝试加油助威。

例如,谷歌人工智能工作室的产品负责人洛根・基尔帕特里克(Logan Kilpatrick)上个月发文称,Gemini 在 “通关《精灵宝可梦》” 方面 “取得了很大进展”,并且 “已经获得了第五枚徽章(目前表现第二好的模型只有 3 枚徽章,不过使用的是不同的智能体工具)”,这引得皮查伊打趣道:“我们正在研究应用程序编程接口,也就是人工宝可梦智能呢:)”

为什么是《精灵宝可梦》呢?今年 2 月,人工智能公司 Anthropic 强调了其 Claude 人工智能模型在玩《精灵宝可梦 红》时取得的进展,称 Claude 的 “扩展思维和智能体训练” 使其在诸如玩经典游戏这类 “更出乎意料” 的任务上 “有了很大提升”。(《精灵宝可梦 红》和《精灵宝可梦 蓝》是 1996 年首次发布的一款 GameBoy 游戏的不同版本,与长期运营的《精灵宝可梦》系列相关)。甚至还有一个名为 “Claude 玩宝可梦” 的 Twitch 频道,乔尔・Z 称这个频道给他带来了灵感。

尽管 Claude 取得了一些进展,但它似乎还没有通关《精灵宝可梦 红》。这是否意味着 Gemini 在这款游戏上客观上表现更好呢?乔尔・Z 在他的 Twitch 页面上敦促观众:“请不要把这当作衡量一个大型语言模型玩《精灵宝可梦》水平的基准。你无法进行真正直接的比较 ——Gemini 和 Claude 使用的工具不同,获取的信息也不同。”

而且这两个人工智能模型都需要借助外力才能玩这款游戏 —— 这就是前面提到的智能体工具发挥作用的地方。这些工具会为模型提供带有额外信息的游戏截图,让模型决定如何回应(这可能需要调用专门的智能体),然后按下与人工智能指令对应的按钮。

乔尔・Z 承认,为了帮助 Gemini 通关游戏,存在一些其他的 “开发者干预” 行为,但他坚称这不算作弊。

他说:“我的干预提升了 Gemini 的整体决策和推理能力。我没有给出具体的提示 —— 对于像月之山这类特定挑战,没有攻略或直接的指导。唯一有点接近的情况是,我让 Gemini 知道它需要和一个火箭队成员交谈两次才能拿到电梯钥匙,不过这是一个后来在《精灵宝可梦 黄》中修复了的漏洞。”

此外,他还表示:“‘Gemini 玩宝可梦’ 仍在积极开发中,其框架也在不断完善。”

本文转载自TechCrunch,本文观点不代表雅典娜AI助手YadiannaAI立场。

(0)
Athena的头像Athena
上一篇 4天前
下一篇 3天前

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

客服邮箱: kefu@yadiannaai.com

投稿邮箱:tougao@yadiannaai.com

合作邮箱:hezuo@yadiannaai.com

关注微信