对策论一

对策论中从一个例子解释对策的基本要素:例子是囚徒困境:警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑 18 个月;如果双方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方面将被判刑 7 年。惊恐

所有的情况如下:                        A人

  供认      不供认

                 B人供认   (3,3)(7,0)

不供认  (0,7)   (1.6,1.6)

局中人:就是参与博弈的人员,上面的例子种A,B人为局中人,(在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。通常用I 表示局中人的集合.如果有n 个局中人,则 I = {1,2,L,n}。一般要求一个对策中至少要有两个局中人。)

策略集:一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人ii I ,都有自己的策略集Si。一般,每一局中人的策略集中至少应包括两个策略。理论这样解释,说的通俗一点就是在一局的博弈的时候AB人要有参考的选项,比如:自己供认的情况下得到什么,不供认的情况下得到什么。有一定的选择性。

赢得函数(支付函数):在一局对策中,说的简单一点,猜拳游戏中,要三局二胜,进行一次猜拳就是进行一局对策。
一个策略组S=(s1,s2.....sn)就是一个局势。
全体局势的集合S =(S1,S2.....Sn) 可用各局中人策略集的笛卡尔积
也就是说,在一局中确定你要做出的决定Si,S为完成所有局的S=(S1,S2.....Sn).
局中人i可以得到一个赢得Hi (s) 。显然, Hi (s) 是局势s 的函数,称之为第i 个局中人的赢得函数。这样,就得到一个向量赢得函数H (s) = (H1(s),..,Hn (s))




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值