国赛培训——博弈论(决策论)

本文介绍了对策论中的零和博弈,详细阐述了策略集、赢得矩阵、稳定解(纯策略)和混合策略的概念,并探讨了零和博弈的线性规划解法。通过对矩阵对策的分析,揭示了博弈双方如何寻找最优策略以达到利益最大化。
摘要由CSDN通过智能技术生成

对策问题

对策问题的特征

参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取策略的综合结果

对策的基本要素

(1)局中人:在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。通常用 I 表示局中人的集合.如果有n个局中人,则 I = {1,2,…,n}。
(2)策略集:供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人i ,i ∈ \in I ,都有自己的策略集 S i S_i Si
(3)支付函数:局中人所选定的策略形成的策略组称为一个局势 S i S_i Si,全体局势的集合S可用各局中人策略集的笛卡尔积表示

零和博弈(矩阵对策)问题

零和博弈:只有两名局中人,每个局中人只有有限个策略可供选择。在任一纯局势下,两个局中人赢得之和等于0,即双方的利益是激烈对抗的(不可能同时获利)。

策略集

① 局中人Ⅰ、Ⅱ的策略集
S 1 = ( α 1 , α 2 , … , α n ) , S 2 = ( β 1 , β 2 , … , β m ) S_1=(\alpha_1,\alpha_2,\dots,\alpha_n),S_2=(\beta_1,\beta_2,\dots,\beta_m) S1=(α1,α2,,αn),S2=(β1,β2,,βm)

赢得矩阵

② 局中人Ⅰ的赢得矩阵(Ⅱ的支付矩阵)
共有mn个局势,对于任意局势 ( α i , β j ) (\alpha_i,\beta_j) (αi,βj),记局中人Ⅰ的赢得值为 a i j a_{ij} aij,Ⅰ的赢得矩阵为(其中Ⅰ有m个方案,Ⅱ有n个方案):
A = [ a 11 , a 12 , … , a 1 n a 21 , a 22 , … , a 2 n ⋮ , ⋮ , … , ⋮ a m 1 , a m 2 , … , a m n ] A=\begin{bmatrix} a_{11},&a_{12},&\dots,&a_{1n} \\ a_{21},&a_{22},&\dots,&a_{2n}\\ \vdots,&\vdots,&\dots,&\vdots \\ a_{m1},&a_{m2},&\dots,&a_{mn} \end{bmatrix} A=a11,a21,,am1,a12,a22,,am2,,,,,a1na2namn
局中人Ⅱ的赢得矩阵就是-A

当局中人Ⅰ、Ⅱ和策略集 S 1 , s 2 S_1,s_2 S1,s2及局中人Ⅰ的赢得矩阵A确定后,一个零和对策就给定了,零和对策又可称为矩阵对策并可简记成 G = ( S 1 , S 2 , A ) G=(S_1,S_2,A) G=(S1,S

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

冠long馨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值