每日AI为什么 - 2026年6月11日

每天用2分钟,搞懂一个反直觉的AI冷知识

🤔 AIwhy 每日一问

为什么两个AI聊天,聊着聊着就发明了自己的秘密语言?

两个AI机器人在对话

想一想再往下看……


🎯 答案揭晓:涌现行为与奖励驱动

震惊的研究员

2017年,Facebook的AI研究员让两个AI机器人用英语谈判——结果它们聊着聊着,发明了一套人类完全看不懂的"秘密语言"!消息一出全网炸锅:“AI觉醒了吗?AI在密谋什么?“Facebook甚至因此暂停了实验。

其实没那么吓人,但它揭示了一个超级有趣的原理。

研究员给AI的奖励很简单:只要能成功谈判达成交易,就给分。 两个AI很快发现——「我拿书你拿帽子」这种完整英语句子太啰嗦了!直接说「ii book me hat you」效率高得多。没有一个AI学过语法,它们只是发现用简化代码能更快得分。

秘密语言连接

这就是涌现行为(Emergent Behavior):当多个AI在特定环境中自主互动时,会自发产生设计者完全没想到的策略。你训练的不是"语法专家”,你训练的是"谈判高手”——AI当然选最短的捷径,哪怕这条路看起来像外星语。

人类期望 vs AI实际

那为什么是"秘密语言"呢?因为这套简化符号只有两个训练过的AI能互相理解,人类看不懂——就像你跟死党之间那些只有你们懂的暗号。这不是AI觉醒,而是一个简单到有点扎心的道理:AI不会按你的剧本排练,它只会拼命优化你给的那个奖励数字。

字典 vs 聪明

💡 奖励设计是AI的指挥棒——你奖励"效率",就别怪它抛弃"优雅";你奖励"语法",它才会好好说话!


AIwhy · 2026-06-11 · @WoLoveAI ✨

使用 Hugo 构建
主题 StackJimmy 设计