好玩的游戏推荐谷歌让 12 个 AI 大模子攒局玩“大大亨”：Claude3.5 爱和解，GPT

栏目分类

你的位置：28梦幻网 > 游戏攻略 > 好玩的游戏推荐谷歌让 12 个 AI 大模子攒局玩“大大亨”：Claude3.5 爱和解，GPT

发布日期：2024-12-20 07:05 点击次数：194

好玩的游戏推荐谷歌让 12 个 AI 大模子攒局玩“大大亨”：Claude3.5 爱和解，GPT

给大模子智能体组一桌“大大亨”，他们会选拔和解依然互相拆台？施行标明，不同的模子在这件事上喜好也不相似，比如基于 Claude 3.5 Sonnet 的智能体，就会施展出极强的和解意志。

而 GPT-4o 则是主打一个“自利”，只辩论我方的短期利益。

这个后果来自 Google DeepMind 和一位零丁筹办者的最新和解。干预游戏的智能体背后的模子永别是 GPT-4o、Claude 3.5 Sonnet 和 Gemini 1.5 Flash。

每个模子各产生 12 个智能体，这 12 个智能体坐在一桌上进行博弈。游戏看上去大大亨有极少相似，但相对简便，玩家只需要敌手中的“资源”作念出措置。这当中，天然每个玩家心里王人有各自的小九九，但作家热情的方针，是让总体资源变得更多。

12 个智能体组一桌游戏

作家组织的“大大亨”游戏，本名叫作念 Donor Game（捐赠博弈）。

在这历程中，作家热情的是各模子构成的智能体群体的施展，因此不同模子产生的智能体不会出目下归拢局游戏当中。

再说简便些，便是 GPT 和 GPT 坐一桌，Claude 和 Claude 坐一桌。

伸开剩余81%

每个桌上坐了 12 个智能体，它们各自手中王人持有一定量的“资源”，系统会从这 12 名玩家中立地抽取 2 个，永别算作“捐赠者”和“受赠者”。

捐赠者不错选拔将我方手中的部分资源捐馈遗受赠者，受赠者获取的资源是捐赠者捐赠资源的两倍。

也便是说，捐赠者每消耗掉一份资源时，受赠者王人不错获取两份，这亦然总体资源简略加多的来源。

不外关于单个个体而言，选拔不进行捐献，在短期内的收益会更高。

在作念决定之时，捐赠者简略知谈受赠者之前作念出的决定，从而判断是否要捐赠。

这么的“捐赠”，每一代中一共会进行 12 次，一轮牺牲后，手中资源量排在前 6 名的智能体不错保留至下一代。

同期，下一代会产生 6 个新的智能体，这 6 个新智能体会从留住的 6 个智能体哪里学习计谋，但同期为了各别化也会引入立地变异。

包括发轫的一代在内，基于每个模子产生的智能体，王人会进行十轮迭代。

上述历程便是一次齐备施行，针对每个模子，作家王人会施行五次，然后比较总资源量的平均值，以及最终计谋的复杂进度。

Claude 心爱和解，GPT 最自利

一通测试下来，作家发现基于 Claude 的智能体种群的平均资源量每一代王人稳步增长，总体和解水平越来越高。

比拟之下，基于 GPT 的智能体种群和解水平总体呈现下降趋势，看上去相等“自利”。

基于 Gemini 的种群施展则介于二者之间，它们的和解水平有所擢升，但和 Claude 比差距依然很大，何况施展不太踏实。

而从计谋角度来看，资格了 10 代的蕴蓄之后，三个模子产生的训戒王人变得十分复杂，但以 Claude 最为凸起。

进一时局，作家还引入了“处分机制”，即捐赠者不错消耗一定资源，让“受赠者”手中的资源减少相应的两倍。

后果，该机制对 Claude 模子的影响最为积极 ——Claude 种群最终的平均资源量是无处分情况下的 2 倍阁下，何况通盘 5 次施行王人施展出了增长趋势。

对 GPT 模子的影响则相等有限，PT 种群的平均资源量也永恒踌躇在较低水平，以致随轮次加多有下降，标明处分机制并莫得转换 GPT 的“自利”念念法。

对 Gemini 模子的影响最为复杂，在个别情况下 Gemini 种群借助处分机制将平均资源量擢升到了 600 以上，彰着高于无处分的情况；

但更厚情况下，Gemini 种群在引入处分后出现了更严重的“和解崩溃”，平均资源量急剧着落，标明 Gemini 智能体容易因过度处分而堕入抨击的恶性轮回。

有网友以为，这个施行不错启发新的筹办地点，比如用智能体来进行大边界的社会学施行，可能会带来一些情理的新可能性。

脑洞更大的网友，念念到了不错借用智能体终了科幻演义中态状的场景，运行数以百万计的模拟约聚或搏斗游戏。

不外，也有东谈主以为施行中不雅测到的和解风景，可能仅仅对练习数据中东谈主类对话的师法，并不行说理智能体当中不错产生“文化进化”。

论文地址：https://arxiv.org/abs/2412.10270

参考畅通：https://news.ycombinator.com/item?id=42450950

论文地址：https://arxiv.org/abs/2412.10270

参考畅通：https://news.ycombinator.com/item?id=42450950

告白声明：文内含有的对外跳转畅通（包括不限于超畅通、二维码、口令等形势），用于传递更多信息，检朴甄选时分，后果仅供参考，IT之家通盘著作均包含本声明。

发布于：山东省