如何计算近似纳什均衡_网络与市场中的计算思维-5.博弈论的基本概念

本系列文章为笔记,内容根据北京大学《网络与市场中的计算思维》MOOC

更新:一个介绍博弈论的,很有意思的小游戏

https://sekai.co/trust/

何为博弈


“田忌赛马“就是一种博弈
博弈三要素:

  • 参与人(玩家)
  • 策略集(战略)
  • 回报(收益,支付)

博弈论中的博弈不总是讲输赢

f918bc41b32fe4dcc8baeece0d95c5e4.png


例子:明天有一个考试,同时交一个课程报告
两个学生面对的选择:复习功课、准备报告

6159cf95b74fb83ed4128254740a7afd.png

博弈推理的假定

  • 自己的回报是每个参与人关心的唯一因素
  • 参与人都是“理性人”,即只要可能,总要选择更好的回报策略
  • 每个参与人都对博弈结构完全了解

小结

  • 一个博弈,有三个基本要素:参与人、策略、回报
  • 博弈论关心的,是博弈的结果,即何种策略组合被参与人(联合)采用
  • 为了严格地推理博弈的结果,需要有“理性人”等一些基本假设

何为博弈的解


如果存在一个策略,能够让所有参与人都满意,就称为这个博弈的解

58a22135e3997afa78995e19ee1a11cd.png


田忌赛马中,就不存在解(每种策略都存在负数)

小结

  • 一个博弈的解,是“稳定的策略组”,要求是其中任何参与人不可能通过单方面改变策略而获得更好的回报
  • ——”稳定的“在博弈推理假设下不可能再变化
  • 不是所有博弈都有解
  • 这里解的概念,实际上就是博弈均衡的概念

博弈的求解

5a6d4e726a87003d5c2d2e03500b7b43.png
  • 1严格占优策略:对一个参与人来说,若存在一个策略,无论另一个参与人选择何种策略,该策略都是严格最佳的选择,则这个策略就称为是前者的严格占优策略
  • 按照博弈推理假设,参与人将选择严格占优策略

在这个例子中,参与人1的严格占优策略是D,无论参与人2如何选择,都比策略U要好。同理,参与人2的严格占优策略是R

囚徒困境

6e2ce754fd9ad4c09c5104d98cd86ba7.png

8b9ba56a561bd7d92f90b45caf85a6f6.png


两人的严格占优策略都是“坦白” 最佳应对

f1e657ba0bbe0ceea751de16c21cea17.png

严格与不严格

9f71d624eb0452f289c43a390a179847.png
  • U是参与人1的严格占优策略;R是参与人2的占优策略,但不是严格的
  • L是U的最佳应对,但不是严格的;R是D的严格最佳应对

小结

  • 如果两人都有严格占优策略,可以预计他们均会采取严格占优策略
  • 如果只有一个人有严格占优策略,则他会采取,而另一方会采取此策略的最佳应对(一定会有!)

纳什均衡与混合策略


演进思路

c2db2ba1415da5364adf30ec8ec7bf08.png

纳什均衡

27aa313b4bfa2846b16e0e64015a0ff6.png

协调博弈
如果两个人走失了,希望互相找到,就会形成以下策略

2c218b4b8caa23ad84c67850efb5a04a.png


这个博弈有两个纳什均衡 鹰鸽博弈

8777b2291eed78f4ee286e734af59d94.png
  • 两个均衡,不能推断到底哪个均衡会出现
  • 一般来说,纳什均衡概念能有助于缩小预测范围,但它并不一定能给出唯一的预测

零和博弈——不存在纳什均衡的博弈
硬币配对:双方各持一枚硬币,分别决定出示手中硬币的某一面。若你们硬币的朝向相同,他将赢得你的硬币。反之,你赢得硬币

e9d3465b3b7eba9f2afb58221d65ce56.png

混合策略
引入随机性,考虑参与人将以一定概率选择策略,一个概率对应一个策略,称为混合策略。
此时,选择策略就是选择概率,而博弈矩阵中给出的选项称为“纯策略”
通常所有策略的概率和为1
先考虑“博弈三要素”

参与人

策略(概率)

回报
此时的策略是概率上的选择,每一组纯策略是对应有固定收益的。因此,从概率意义上出发,此时的收益应该体现一种在两种纯策略上的“平均”(期望)

0f87312553a9345278b506c41eee2dcd.png


但是,在研究一个混合策略博弈的时候,我们一般不关心在每个策略下的具体回报,而是关心能否达到均衡?在什么混合策略组下达到均衡

4df9b60bddf97728035642bed42e6a6e.png

a9ca40b8bb93362ca108a1d8feb7968e.png


一个博弈,如果没有纯策略均衡,就一定有混合策略均衡
一个博弈,如果有纯策略均衡,还可能有混合策略均衡

小结

  • 博弈均衡有两种
    • 纯策略博弈
    • 混合策略博弈
  • 任何博弈都存在均衡
    • 可能一个,也可能多个
    • 可能是某一种,也可能两种都有

博弈的解与社会最优

社会最优
总福利最大的策略组合

c615fe48c242d6d0da5476c5dd29e8b1.png


均衡是博弈的解,但不一定是社会最优
从社会学意义讲,均衡与社会最优一致的系统是理想系统


博弈论基本概念总结

  • 博弈三要素
  • 作为博弈推理基础的三个假设
  • 便利博弈推理的几个概念
  • 纳什均衡
  • 简单混合策略博弈的求解(无差异原理)
  • 均衡与社会福利
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值