200万一夜的天价“学费”:米哈游真在认真搞AI
5月20日的阿里云峰会上,米哈游《崩坏》系列AI技术团队负责人郑银河分享了一个让人有点憋不住的血泪经验:公司有同事为了实现项目,搭建了几十个AI 特工共同协作,一晚上烧掉了价值200万人民币的大模型代币。200万听响?AI也摸鱼
这200万花的不冤:几十个AI被安排在一起开会干活,结果他们互相等对方先说话,等到就开始循环递纸条,谁也肯先停下来。等到第二天人类员工上班观看,会开 整整齐齐一宿合着全是摸鱼,活没干出什么名堂,账单先到了。
磨砺了200万,够了一个中小团队发一个月工资,够在公司楼下咖啡厅包场包到地老天荒,而米哈游这200万,只是让AI们彼此吃了一个晚上嘴皮子;许多玩家刷到了一条消息以后化身乐子人,直呼“有钱任性”。
大多数公公 但郑银河当着一屋子同行坦然承认:“我们接受在探索AI时有成本、有学费,这也有助于更完善我们的代理平台。”
这让人想起前大伟哥轰动行业的表态:未来三年在AI领域“最多投入1000亿”,如果最终没成,“也认了了” ,福利做一个大烟花”。
200万之于1000亿,不过九牛一毛。但当一个游戏公司折腾特工折腾到一万晚上花掉200,至少说明他们不是嘴上说说。特工协作的技术死穴:循环等待
多特工架构的休闲休闲分工协作。郑银河将米游对特工的探 分为三个阶段:L1是基础聊天产品,L2光标为代表的辅助工具,L3为“睡眠驾驶模式”,多个Agent很好地完成复杂任务,一个Agent负责代码审查,一个负责资源生成,一个负责配置检查,理论上可以像一个微型开发团队那样运行。
但多Agent架构也有 一个天然的死穴:循环等待。
每个Agent都在等另一个Agent的输出,每个Agent的输出又触发下一个Agent的调用。如果缺乏有效的循环检测机制,它们就会陷入一种“我等你回复,你等我回复”的循环等待。在学术界,这种架构被称为“完全循环子任务图”,有指出论文 ,这种设计使得Agent能力最大化,但调整极高。而在产业界也有分析提到,每个Agent单步成功率高达98%,经过多次未检查的手术成功后,系统整体率会急剧下降至90%甚至更高,而每次失败和重试都在最大化成本。
换句话说,在偶然的操作逆转之外,这更可能是所有探探 索多Agent架构的技术团队几乎都会踩的坑。米哈游只是踩得更早,并且选择了公开。从万级AI应用到千亿级豪赌
就在今年4月,《崩坏:星穹铁道》4.2版本正式上线了千万级的AI助手“帕姆帮”,标志着米哈游自帮研大模型Glossa首次大规模推进成熟的商业产品。 崩坏:星穹铁道循环制、二次元、RPG、卡牌、养成、科幻查看更多立即下载
上线短短一周,玩家累计对话量突破6000万次,帕姆被玩家循环了近160万回,还倾情献唱了13万多次帕姆之歌。
从“帕姆帮帮”这样的消费级应用,到了几十个特工进行的“第三驾驶”实验,米哈游的AI布局显然没有停留在PPT面上。早在特工概念走红之前,米哈游就开始已经行动了。
2018年,公司内部成立了专注于AI和元宇宙相关技术研发的“逆熵”团队,2022年升级为“逆熵科技研究院”。如今内部自研的Echo Agent平台不仅是一个聊天窗口,更是一个托管Agent的生态系统,用户可以根据需要拼接不同功能的Agent模板,一键运行。
而该款在5月27日,米哈游招聘公众号多次呼吸曝光了8个预研产品,其中7个明确绑定AI方向,从写实拍摄到生活模拟、从3D MOBA到沙盒,几乎每一款产品的关键词都看到AI的图表。
把这几件事串在一起看,米哈游的AI路径就标注了:2018年埋下种子,2026年从消费级应用到多代理实验同时推 进,千亿投入一个确定未来三年的方向。现在再深入看大伟哥那场宣讲会,他的判断再明显不过:“任何团队没有坚定地去搞算力、规模这件事,是方案可能把模型实现精密的”。
在他看来,三年之内,就 会出现“千人千面”的游戏体验,AI介入后,游戏能够实时生成玩家想要的内容,提供个性化的体验,就像今天打开社交平台,首页的内容由算法、最终看到人而异一样。
而要实现这种体验, 就必须先在Agent架构上闯出一条路。200万,不过是这条路上的记账路费。AI上的抢占正在发生
放眼国内游戏行业,AI领域的介入已经明显分叉梯队。
腾讯在GDC 2026年上贡献了21场AI分享,AI已在40多款产品中落地,谷歌高管在演讲中特别指出腾讯已将AI深度集成至《王荣耀者》《和平精英》等游戏中。网易明确要让“儿童把工作助理AI”,从美术到策划全链条都在推AI化。完美世界、鹰角网络等厂商也纷纷加入。
有初步人员判断,放弃游戏公司完成AI基础建设的时间窗口限度一到两年,完成能力跑出来的团队和仍在观望的团队,差距将彻底拉开。
在此背景下看米哈游的200万次实验,能够书写不一样的含义,它至少说明三件事:第一,米哈游对Agent的应用已经不是 单点实验,却系统性地向多代理良好的L3阶段发起冲击;第二,面对必然会产生的技术试错成本,他们选择了公开遮掩;第三,当大伟哥说“做不成当放烟花”的时候,米哈游不是在赌,而是在算清楚自己能承受多少“学费”之后,做了一个理性的选择。
米 哈游这200万花得值不值,外人不好评价。但当一家游戏公司折腾代理,折腾到一晚上烧掉200万的地步,那么说明他们是真的在认真做投入,AI这条路,米哈游真打算一步一步走过去的。
你看好米哈游未来的AI发展方向吗?评论区聊聊你的看法。



















