博弈论学习笔记（二）学会换位思考

最新推荐文章于 2024-07-22 14:50:35 发布

aishanmeng5704

最新推荐文章于 2024-07-22 14:50:35 发布

阅读量423

点赞数

文章标签： ui

原文链接：http://www.cnblogs.com/junealan/p/4331428.html

版权

博弈的三个要素

参与者 player
策略 strategy
利益 payoffs

si    第i个参与者的策略
S     策略集合
Ui    第i个参与者选择策略si的利益

我们假设现在有两个参与者1和2,对于player1
我们说si'是si的劣势策略，当且仅当不管player2选择什么策略sj,U1(si,sj)>U1(si',sj)。
我们说si'是si的弱劣势策略，当且仅当不管player2选择什么策略sj,U1(si,sj)>=U1(si',sj)。

例子

大约在公元前三世纪，骑大象的汉尼拔将军想要侵略罗马，这里有两条路可以选择：一条路崎岖，需要翻越阿尔卑斯山；另一条平坦，只需沿着海岸线走。如果侵略者选择崎岖的路，仅翻越的过程中就会损失一个营的兵力；如果他碰到了你驻守的兵力，不管它走那条路，他都得再损失一个营的兵力。入侵者只能选择其中的一条路进行入侵，防御者只能选择一条路防御。我应该选择哪一条路进行防御。

	α	β
α	2,0	0,2
β	0,1	1,1

这里假设α指崎岖的路，β指平坦的路。
其中左边的是我能够消灭的营的数量，右边的是汉尼拔将军能够保留的营的数量（假设他只有两个营，失去两个营他将会全军覆没）。
显然对于汉尼拔将军来说，策略β弱优于策略α，所以汉尼拔将军会选择策略β。
在汉尼拔将军选择β后，我选β能够得到较好的收益。
（事实上汉尼拔将军当时选择了翻越阿尔卑斯山。）

上一节课的题目
全班同学选择1到100之间的的一个数字，在不告诉别人的情况下，谁选的数字越接近平均数的三分之二，谁就获胜。你选的数字是什么？

第一次筛选：那些选择大于67的数会被淘汰，因为就算所有人都选择100，答案也是67又2/3。所以选择范围缩小到1到67。
第二次筛选：那些选择大于44的数会被淘汰，因为就算所有人都选择67，答案也是44又2/3。所以选择范围缩小到1到44。
第三次筛选：那些选择大于29的数会被淘汰，因为就算所有人都选择44，答案也是29又1/3。所以选择范围缩小到1到29。
。。。。。。
答案最终收敛为1。

选择45到67的人觉得别人都很愚蠢。
所以这里涉及到一个“我知道你知道我知道你知道……”的过程。 -- 共同知识 common knowledge
所以如果大家都是理性的，那么最优策略就是1。

但是最后统计得到的所有数的平均数是13又1/3，最接近他的2/3的数是是9，大于1。因为事实上并不是每个人都是理性的。

当我们再次进行一遍这次游戏的时候，所有人选择的数普遍都比之前要小了，因为大家都变得老练了。

因为不仅我们自己玩这个游戏玩的更好了，我们也了解到我们周围的人玩这个游戏玩的更好了。
对这个游戏的分析不仅让每个人都变得更老练了，也使你更了解别人老练的程度，并且你知道别人知道你知道如何玩到这个游戏。
从中我们得出一个重要结论：不仅你要站在别人的立场上思考别人的收益是怎么样的，你还要站在别人的立场上思考他们在博弈时有多老练，并且你还要考虑到他们认为你有多老练，还要考虑到他们认为你认为他们有多老练。

转载于:https://www.cnblogs.com/junealan/p/4331428.html

aishanmeng5704

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
博弈论学习笔记（二）学会换位思考

博弈的三个要素参与者 player策略 strategy利益 payoffs si第i个参与者的策略S策略集合Ui第i个参与者选择策略si的利益我们假设现在有两个参与者1和2,对于player1我们说si'是si的劣势策略，当且仅当不管player2选择什么策略sj,U1(si,sj)>U1(si',sj)。我们说si'是si的弱劣...
复制链接

扫一扫