对策论一

最新推荐文章于 2023-01-02 23:25:18 发布

MonekyDEcho

最新推荐文章于 2023-01-02 23:25:18 发布

阅读量590

点赞数

分类专栏：数模

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26661607/article/details/47085665

版权

数模专栏收录该内容

2 篇文章 0 订阅

订阅专栏

对策论中从一个例子解释对策的基本要素：例子是囚徒困境：警察同时逮捕了两人并分开关押，逮捕的原因是他们持有大量伪币，警方怀疑他们伪造钱币，但没有找到充分证据，希望他们能自己供认，这两个人都知道：如果他们双方都不供认，将被以持有大量伪币罪被各判刑 18 个月；如果双方都供认伪造了钱币，将各被判刑 3 年；如果一方供认另一方不供认，则供认方将被从宽处理而免刑，但另一方面将被判刑 7 年。

所有的情况如下： A人

供认不供认

B人供认（3，3）（7,0）

不供认（0，7）（1.6,1.6）

局中人：就是参与博弈的人员,上面的例子种A，B人为局中人，（在一个对策行为（或一局对策）中，有权决定自己行动方案的对策参加者，称为局中人。通常用I 表示局中人的集合．如果有n 个局中人，则 I = {1,2,L,n}。一般要求一个对策中至少要有两个局中人。）

策略集：一局对策中，可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人i， i ∈ I ，都有自己的策略集Si。一般，每一局中人的策略集中至少应包括两个策略。理论这样解释，说的通俗一点就是在一局的博弈的时候AB人要有参考的选项，比如：自己供认的情况下得到什么，不供认的情况下得到什么。有一定的选择性。

赢得函数（支付函数）：在一局对策中，说的简单一点，猜拳游戏中，要三局二胜，进行一次猜拳就是进行一局对策。

一个策略组S=(s1,s2.....sn)就是一个局势。

全体局势的集合S =(S1,S2.....Sn) 可用各局中人策略集的笛卡尔积。

也就是说，在一局中确定你要做出的决定Si，S为完成所有局的S=(S1,S2.....Sn).

局中人i可以得到一个赢得Hi (s) 。显然， Hi (s) 是局势s 的函数，称之为第i 个局中人的赢得函数。这样，就得到一个向量赢得函数H (s) = (H1(s),..,Hn (s))。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。