谷歌用70页论文长篇大论地介绍Gemini 2.5 Pro玩《宝可梦蓝》的具体情况,这里面“Pokemon”关键词都出现59次,这可真是引起了大家的关注!咱们一起来聊一下这个神奇事究竟是怎样一番景象。
直播开启新旅程
3月底的时候独立开发者Joel Zhang在Twitch上搞了个“Gemini玩宝可梦”直播间。起初,这大哥只是想直播展示能玩完整游戏的智能体工具的开发过程。可谁能料到,Gemini 2.5 Pro这家伙太厉害,测试的时候直接就把游戏给通关了,摇身一变成为了宝可梦联盟冠军,进入名人堂,那简直就是走上了AI界的巅峰
通关困境被破解
在游戏过程中,这AI碰到了麻烦。有一回,它陷入了因为游戏程序bug造成的软锁定死循环,一般情况下这可是个死路,没有任何解决办法。但是,谷歌觉得这种情况正常游戏里遇不到,说明训练数据没透露到模型知识库中,这Gemini 2.5 Pro是自己在推理阶段想出办法突破的,这能力真是太惊人!
子任务也不在话下
对这AI来说每走一步可能要完成十几个子任务。就拿05号技能闪光来说,人类玩家想完成都得查攻略去做一系列游戏任务,但Gemini 2.5 Pro这货也顺利搞定。就像游戏里特殊区域,进去一次得花500金币,进去后只能走500步,超了就被踢出来钱就没了。可它不仅要记住去过哪里、打败谁,还得管理宝可梦血量,去对付野生宝可梦和训练师。
意外发现游戏bug
更有意思的是,Gemini它解决那个谜题的时候,顺带还发现了游戏代码里一个bug,这可能是AI第一次发现这种情况。有网友还详细介绍了这bug原理,就是在解决一半谜题后主动重置再解决另一半,游戏开发者估计都没想到有这种操作,所以就留下了这个bug。
AI推理现幻觉
不过,这AI也有不靠谱的时候。当它的目标设定、游戏总结等很多处被错误信息干扰后,就好像被洗脑,干着没意义的事还坚信自己是对的。就像那段它在推理阶段的内心独白“让我试着穿过房子入口,再出来,但愿堵住入口的守卫会移动”,人类看了都觉得可笑,可它却一根筋。人类玩家会想到“近路未必是对的” ,可这AI老在这种地方犯轴。
两款AI竞争持续
为了减少这种毛病,第二次通关的时候在提示词里让AI扮演对游戏完全陌生的玩家,别管那些先验知识。现在,AI玩宝可梦的直播项目还在继续,而且Claude 4也加入进来和Gemini 2.5 Pro一起比谁先通关,目前Gemini 2.5 Pro已经又先通关,开始去挑战《宝可梦黄》原版的困难模式。咱就说这以后还会有啥神奇发展着实让人口渴(期待),各位看完文章咋想的,赶紧点赞分享讨论起来?