1. 何为博弈
博弈即根据他人预期的互动决策。
基本要素有:参与者、行动备选项、以及收益
2. 博弈行为推理
基本假设有:个人利益最大化,对于博弈结构有了解
在这之中,博弈有多种类型,其中博弈情景的设置起到了重要的影响,而且参与者的交互程度也有很重要的影响。
经典的例子当属囚徒困境,囚徒困境的关键是无交流,只求最坏情况最好,不求最好情况。
3. 最佳应对与占优策略
应对即其他参与者有策略,我来应对,而占优策略即从我的角度,不论其他人选择什么,我选这个绝对不吃亏。
4. 纳什均衡
一个给定状态,先改变者先吃亏,不动是当前最好的策略。尽管可能有对于大家更好的策略。但是没关系,我们现在还可以。换句话说,只有所有人都开始改变,即大趋势改变,个体才能变得更好,如果个体改变,那么没有赶上大趋势,结果并不好。比如朝鲜现在的国情下,一个人宣传自由民主博爱等观念,下场难说。
5. 多重博弈:协调博弈
矩阵中可能有多个纳什均衡,我需要从中选择一个,最好的情况当然就是大家的结果都比较好,当然也有双方都不好的,也有只有一方比较好的,总的来说,结果有很多,而这时候进行选择到底哪一个纳什均衡就是需要一些额外的信息来判断。
6. 多重均衡:鹰鸽博弈
收益有限,必须通过掠夺式的方式来获得更多收益,而且还要期望对方不是采取相同的策略。
7. 混合策略
如果我们将收益画出三维的图形,坐标轴为xy即双方分别得策略,z轴为收益,那么波峰和波谷在一起将永远不会稳定。那么根本就不会有什么纳什均衡,很难想象水火相容的场景,大多都是此消彼长,所以要计算一下概率,看看可能什么情况对我比价好。因此应该随机化策略,使得最坏情况最好。
8. 混合策略:案例与经验分析
其实我的混合策略是为了方式对方根据我的策略的侧重点来针对性的防守使得我的收益减小,比方说我的两个策略从对方的角度来说采取某一个策略使得对方的收入更多,那么对方就会更多的采取那个策略,最终使得我的收益减小,因此混合策略是为了是我的每一个策略都更均衡,使得对方找不到我的弱点。
关键是为了收益无差异!
9. 帕累托最优与社会最优
帕累托最优即非不好,不好的策略就是我们大家伙可以都找到更好的一个选择使得我们每个人都比现在要好,非不好就是去掉这些,我认为帕累托最优就是去掉了非常不好的选项之后剩下的都是帕累托最优,所以数量也是相对比较多。
社会最优就是个体收益之和最大。社会最优一定是帕累托最优。纳什均衡和帕累托最优互有交集。
10. 深度学习材料:非优策略与动态博弈
非优策略:
我们对于策略的选择首先可以是选择优势策略,不过如果找不到,可以从非优策略逐渐删除——严格非优策略的迭代删除法。
在设施选址的问题上,我们的策略就是使得对方没有过多的机会可乘,就是我的最坏的情况最好。
当然,可以排除严格非优,但是弱非优不能轻易排除。
动态博弈:
加上时间序列进行分析,扩展性时的博弈可以首先在矩阵中选择备选策略,然后检验具有实际意义的那些可能。