python博弈论_通过几个例子理解博弈论与纳什均衡

最新推荐文章于 2024-06-09 15:52:45 发布

weixin_39602005

最新推荐文章于 2024-06-09 15:52:45 发布

阅读量1.2k

点赞数

文章标签： python博弈论

喜欢玩德州扑克的人应该都听说过“GTO”这个词。GTO，即 GameTheory Optimal，翻译成中文应该叫做“游戏理论最优化”。直接翻译过来有点拗口，通俗一点的解释可以是：在游戏中，你可以采取一种最优策略，使得自己的损失最小，同时游戏中的对手也必须采取相对应的策略，否则只会扩大你的受益。

讲到GTO，就不得不提到博弈论中非常著名的一个理论：纳什均衡(Nash Equilibrium)。该理论是由著名的经济学家，博弈论创始人，诺贝尔奖获得者约翰·纳什提出的，也就是电影《美丽心灵》的男主角原型。该理论是说：在非合作类博弈中，存在一种策略组合，使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”，那么对于任何一位参与者来说，单方更改自己的策略不会带来任何好处。

约翰·纳什证明了在每个参与者都只有有限种策略选择，并允许混合策略的前提下，纳什均衡一定存在。上边的解释还是有点拗口，这里通过几个例子，更直观的理解一下这个理论。

囚犯的困境

假设有两个小偷A和B联手闯入民宅盗窃被抓，警方将两人置于不同的房间进行审讯，并给出如下政策：如果一个犯罪嫌疑人坦白并交出了赃物，两人都会被判有罪。如果另一个犯罪嫌疑人也坦白，则两人各被判刑8年；如果另一个犯罪嫌人抵赖，再加刑2年，而坦白者有功，会被立即释放。如果两人都抵赖，偷窃罪证据不足，但会因私入民宅而各判入狱1年。即：

表中的数字表示A，B各自的判刑结果。博弈论分析中一般都用这样的表来

最低0.47元/天解锁文章

weixin_39602005

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
python博弈论_通过几个例子理解博弈论与纳什均衡

喜欢玩德州扑克的人应该都听说过“GTO”这个词。GTO，即 GameTheory Optimal，翻译成中文应该叫做“游戏理论最优化”。直接翻译过来有点拗口，通俗一点的解释可以是：在游戏中，你可以采取一种最优策略，使得自己的损失最小，同时游戏中的对手也必须采取相对应的策略，否则只会扩大你的受益。讲到GTO，就不得不提到博弈论中非常著名的一个理论：纳什均衡(Nash Equilibrium)。该理论...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。