重复博弈

重复博弈

有限次博弈

  • 零和博弈
    零和博弈是严格竞争的,与博弈次数无关,策略和原博弈一样。
  • 唯一纯战略纳什均衡
    采取原博弈策略
  • 多个纯战略纳什均衡
    多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。

在有限次重复博弈中,如果G有惟一的纳什均衡,重复博弈G(T)的惟一子博弈精炼纳什均衡结果是阶段博弈G的NE重复T次;而对无限重复博弈来说,即使阶段博弈G只有唯一的Nash均衡,也可能存在着完全不同于一次博弈的子博弈精炼Nash均衡,

无限次博弈

  • 零和博弈
    两人零和博弈无限次重复的所有阶段都不可能发生合作,博弈方会一直重复原博弈的混合策略纳什均衡
  • 唯一纯战略纳什均衡
    冷酷策略
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
以下是一个基础的重复博弈的 Matlab 代码示例: ``` % 清空变量和命令窗口 clear; clc; % 设置博弈参数 r = 1.5; % 收益矩阵中的固定收益 s = 0.8; % 收益矩阵中的罚款 T = 4; % 重复博弈的轮数 alpha = 0.5; % 玩家1的遗忘率 beta = 0.5; % 玩家2的遗忘率 % 初始化策略和收益矩阵 P1 = [0.5, 0.5]; % 玩家1的策略 P2 = [0.5, 0.5]; % 玩家2的策略 payoff = [r,s;s,r]; % 收益矩阵 % 开始重复博弈 for t = 1:T % 玩家1选择策略 if rand() < alpha % 遗忘上一轮的策略 P1 = [0.5, 0.5]; end % 计算玩家1的收益 p2 = P2(randi(2)); p1 = P1(randi(2)); pay1 = payoff(p1,p2); % 玩家2选择策略 if rand() < beta % 遗忘上一轮的策略 P2 = [0.5, 0.5]; end % 计算玩家2的收益 p1 = P1(randi(2)); p2 = P2(randi(2)); pay2 = payoff(p1,p2); % 更新策略 if pay1 > pay2 % 玩家1收益高,更新玩家1的策略 P1 = [p1, 1-p1]; elseif pay1 < pay2 % 玩家2收益高,更新玩家2的策略 P2 = [p2, 1-p2]; end % 输出结果 fprintf('第 %d 轮博弈结果:\n', t); fprintf('玩家1的策略:%.2f %.2f\n', P1); fprintf('玩家2的策略:%.2f %.2f\n', P2); fprintf('玩家1的收益:%.2f\n', pay1); fprintf('玩家2的收益:%.2f\n\n', pay2); end ``` 此代码模拟了两名玩家参与的重复博弈。在每一轮博弈中,玩家1和玩家2都会选择一个策略,并根据收益矩阵计算自己的收益。然后,根据谁的收益更高,玩家1和玩家2可能会更新自己的策略。在每一轮博弈中,玩家1和玩家2都有一定的遗忘率,会忘记上一轮的策略。最后,代码输出每一轮博弈的结果,包括每个玩家的策略和收益。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值