混合策略纳什均衡

最新推荐文章于 2024-03-31 23:04:04 发布

鬼灭之刃

最新推荐文章于 2024-03-31 23:04:04 发布

阅读量6.6k

点赞数 4

分类专栏：博弈论文章标签：混合策略纳什均衡最大最小策略纳什均衡

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A1342772/article/details/78368893

版权

博弈论专栏收录该内容

1 篇文章 0 订阅

订阅专栏

混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策，其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值，否则，一个博弈者会选择那个期望值最高的策略而排除所有其他策略，这意味着原初的状态不是一个均衡。

名词说明

纯策略：1和0 绝对的侧率选择。比如选择去公园和不去公园就是纯策略

混合策略：参与者使他的的纯策略的选择随机化，那么就是混合策略。比如选择去公园的概率是0.6，这就是一个混合策略

举例说明：

设警察去街道的概率是p,那么去公园的概率就是1-p

毒贩去街道的概率是d,那么去公园的概率就是1-d

混合侧率的目标：使得每一纯策略具有相同的期望值

在该情况下：

同理，也可以求出毒贩的d=6/13

纯冲突和防范行为博弈

极大极小策略即用来使参与者达到最优状态的策略，即会设想到其他参与者通过选择策略来使参与者支付最小。

举例说明：

用VH(PH,SM)表示福尔摩斯的期望支付，如果他选择混合策略PH（去多尔佛的概率），SM表示莫瑞特的纯策略。

福尔模式的极大极小策略可以解决以下问题：在已知PH的情况下，当SM被选择来使VH（PH，SM）最小化时，用PH来使VH（PH，SM）最大化。

当莫瑞特去多尔佛时，福尔摩斯的期望支付是VH(PH,)=PH*20+(1-PH)*70=70-50PH

同理可以多瑞特去坎特伯雷时,福尔摩斯的期望支付是VH(PH,)=10+80PH

莫瑞特会根据PH使得福尔摩斯的支付最小，福尔摩斯的极大点是PH=6/13。如果一个参与者知道你会做出的选择，那么你做出随机化的选择将更好。对方很难进行一个揣测。

总结

可以看出混合策略是算别的参与者的支付相等，最终使得每一个参与者无论选择哪一种纯策略都有相同的支付。而最大最小策略是使自己无论选择哪一种策略，都可以获得相同的支付，那么其他参与者就无法通过纯侧率来降低自己的支付。

关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
混合策略纳什均衡

混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策，其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值，否则，一个博弈者会选择那个期望值最高的策略而排除所有其他策略，这意味着原初的状态不是一个均衡。名词说明纯策略：1和0 绝对的侧率选择。比如选择去公园和不去公园就是纯策略混合策略：参与者使他的的纯策略的选择随机化，那么就是混合策略。比如选择去公园的概率是0.6，这就是
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。