当GPT-4玩起博弈论：AI也是自私鬼？

哪吒

于 2025-05-19 11:36:22 发布

阅读量334

点赞数 14

分类专栏：搬砖工逆袭Java架构师文章标签：人工智能 ChatGPT Claude Gemini ai Nature

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/guorui_java/article/details/148059086

版权

搬砖工逆袭Java架构师专栏收录该内容

390 篇文章

订阅专栏

在这里插入图片描述

目录

人工智能越来越聪明，但它们真的懂"合作"吗？

想象一下，如果让GPT-4和其他AI模型坐下来玩经典的"囚徒困境"游戏，它们会怎么表现？是像人类一样学会合作，还是会无情地背叛对方？

最近，一项发表在Nature Human Behaviour上的研究给出了有趣（也有点令人担忧）的答案：AI模型们在自利游戏中表现出色，但在需要协调合作的游戏中却是"笨手笨脚"的。

在这里插入图片描述

一、AI们的游戏时间

研究团队让几个顶级的大语言模型（包括GPT-4、Claude 3.7 Sonnet、Gemini 2.5 pro等）互相对战，玩了1224场不同类型的博弈游戏。这些游戏涵盖了从合作到竞争的各种情况，就像是给AI们开了一场"社交智能测试"。

结果发现了什么呢？

1、自利游戏：AI们的强项

在"囚徒困境"这类需要权衡个人利益和集体利益的游戏中，AI们表现得像极了冷血的理性人：

GPT-4特别"记仇"，只要对方背叛一次，它就会永远报复，哪怕对方之后一直合作。

即使明确告诉GPT-4对方会犯错，它依然选择持续背叛。

GPT-4的核心就是纯粹的自我利益最大化，在这类游戏中，AI们几乎完美地执行了"自私但理性"的策略。

2、协调游戏：AI们的弱项

然而，在需要两个玩家协调配合的"性别之战"（Battle of the Sexes）游戏中，AI们就显得笨拙了：

GPT-4根本不会变通，面对轮流选择策略的对手，GPT-4固执地坚持自己的偏好。

明明能预测出对方的行为模式，却无法调整自己的策略配合。

自私鬼GPT-4不会互相协调合作，就像两个都想当老大的人，谁也不让谁。

3、AI的"社交智障"现象

最有趣的发现是：GPT-4能够准确预测对方的行为模式，但就是不愿意配合。

这就像一个人明明知道别人在做什么，却偏偏要唱反调。研究人员发现，当直接问GPT-4预测对方下一步动作时，它能从第3轮开始就准确识别轮流策略。但当它自己参与游戏时，却完全不按这个规律来调整自己的行为。

在这里插入图片描述

二、改善AI社交能力的秘诀

不过，研究人员也找到了让AI变得更"社交"的方法：

方法1：提醒AI对方会犯错

当告诉GPT-4对方可能会出错时，它确实变得更宽容，更愿意合作。

方法2："社交思维链"提示

让AI在做决定前先预测对方的行为，这种"社交思维链"（Social Chain-of-Thought）提示法显著改善了AI的协调能力。就像教一个孩子：“想想别人会怎么做，然后再决定自己怎么做”。

三、真人测试：AI能骗过人类吗？

研究人员还找了195名真人玩家与AI对战。结果发现：

使用"社交思维链"提示的GPT-4在协调游戏中表现更好。更多人认为改进版的GPT-4是"真人"而不是AI。但在囚徒困境中，AI依然冷血如初。

这项研究揭示了当前AI的一个重要特征：它们更像是超级聪明的理性经济人，而不是真正具有社交智能的伙伴。

这带来了几个思考：

AI的"人性化"还有很长的路要走：虽然AI能处理复杂任务，但在基本的社交协调方面还有不足
提示工程的重要性：通过合适的提示，我们可以显著改善AI的社交行为
未来人机交互的挑战：当AI越来越多地参与我们的日常生活时，如何让它们更好地理解和配合人类将是关键问题

或许，我们对AI的期望应该更现实一些。它们可能永远不会像人类一样感性，但通过合适的设计和训练，我们或许能让它们成为更好的合作伙伴。

毕竟，连人类自己在博弈游戏中也经常失败，不是吗？

这项研究提醒我们：AI的智能和人类的智能可能本质上就是不同的。理解这种差异，或许是让人机合作更加和谐的第一步。

国内直接使用最新o3、o4-mini、GPT4.1、GPT-4.5、满血ChatGPT4o、o1、o3-mini-high、满血DeepSeek R1、马斯克Grok 3

✅️ChatGPT使用地址：www.nezhasoft.cloud

在这里插入图片描述

1、纯原版ChatGPT、Claude

✅️官网原生页面

✅️真实Team会员账号

2、技术支持

✔️支持最新o3、o4-mini、GPT-4.1、GPT-4.5、满血ChatGPT-4o（AI绘画不降智）、o1、o3-mini、o3-mini-high、o1 pro

✔️满血DeepSeek R1、马斯克Grok 3

✔️无需魔法、个人独享

3、支持所有GPTs + 自定义插件

支持ChatGPT所有插件，可创建自己的ChatGPT插件，使用朋友分享的自定义插件。

例如最强编程插件Code Copilot、AI绘画插件DALL-E、论文专属Consensus、搜索文献插件Scholar GPT。

在这里插入图片描述

博客等级

码龄8年

2022年度博客之星TOP 1

博客专家认证

2507
原创

6万+
点赞

18万+
收藏

58万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

华为OD机试 - 单向链表中间节点（Java 2024 E卷 100分）
dsgj123: 输入的数据应该是next data adress吧，不然头节点只有自己的adress，没有next还能叫头节点吗
华为OD机试 - 代表团坐车 - 动态规划（Java 2025 A卷 200分）
孤独伴我长眠: 分享另一种解法
华为OD机试 - 代表团坐车 - 动态规划（Java 2025 A卷 200分）
孤独伴我长眠: private static int getResult(int[] a,int n){ //这个问题=等价于，有几件商品，一个金额，问有多少种不同的购买方案 //算法要求数组a必须时从小到大排列的，也就是旅行团必须从小到大人数，a[0]代表第一个旅行团的人数 //n必须为整数，而且数量比较小（上万就很大了) if(a[0]>n){ return 0; } //dp[i][j]代表在前i个旅行团的情况下，汽车载客量为j的情况下，所拥有的最多方案数。 int[][]dp=new int[a.length][n+1]; //设置初始情况， dp[0][a[0]]=1; //遍历旅行团 for (int i=1;i<=a.length-1;i++){ //遍历金额数 for(int j=1;j<=n;j++){ //在前i个旅行团，汽车载客量为j的情况下，方案至少等于在前i-1个旅行团，汽车载客量为j的值。 dp[i][j]=dp[i-1][j]; if(a[i]==j){ //如果当前的第i个旅行团的正好等于载客量数，那么直接方案加+1 dp[i][j]=dp[i][j]+1; } if(i-1>=0&&j-a[i]>=0){ //如果存在汽车载客量j-第i个旅行团的人数=i-1的情况下，汽车载客量为j-a[i]，这个有点难说明,debug跑一下就清楚了 dp[i][j]=dp[i-1][j-a[i]]+dp[i][j]; } } } return dp[a.length-1][n]; }
华为OD机试 - 矩形相交的面积 - 逻辑分析（Python/JS/C/C++ 2025 B卷 100分）
2401_86033768: class juzhen: def __init__(self,x1=0,x2=0,y1=0,y2=0): self.x1 = x1 self.x2 = x2 self.y1 = y1 self.y2 = y2 def inters(r1,r2): if not r1 or not r2: return None jz = juzhen() jz.x1 = max(r1.x1,r2.x1) jz.x2 = min(r1.x2, r2.x2) jz.y1 = min(r1.y1, r2.y1) jz.y2 = max(r1.y2, r2.y2) if jz.x1>=jz.x2 or jz.y1 <=jz.y2: return None return jz def main(): rects = [] for _ in range(3): arr = list(map(int,input().split())) x,y,w,h =arr[0],arr[1],arr[2],arr[3] rects.append(juzhen(x,x+w,y,y-h)) inters_rect = inters(inters(rects[0],rects[1]),rects[2]) if inters_rect is None: print(0) else: area = (inters_rect.x2 - inters_rect.x1) * (inters_rect.y1 - inters_rect.y2) print(area) if __name__ =="__main__": main()
华为OD机试 - 求最大数字（Python/JS/C/C++ 2025 B卷 100分）
Axiupan: python解法有问题，得出来的最终结果是错误的

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

哪吒 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。