人工智能笔记之专业选修课4.1.5 - 博弈论 6.严格劣势策略

严格劣势策略 strictly dominated strategies

在稳定性和预测上analyzing games in terms of stability, in terms of predicting. ,人们可以想到各种不同的方式来分析博弈。而人们会做什么,遵循什么逻辑是分析博弈的另一个重要方式, 也能给我们一些洞见。
核心思想是当我们考虑博弈论里的理性时,基本的前提为:人们总是希望最大化他们的收益payoffs,因此他们总是在尝试最大化他们的收益。这并不是说他们都是贪婪的,收益可以是利他的altruistic ,或者利于大众的。
这里的前提是人们有某种客观的函数, 人们会倾向于选择让他们得到更高收益的行为,而不是更低收益的行为,我们要做的是思考:
  • 如果博弈者知道其他人会最大化他们的收益?
  • 我们会知道博弈结构是怎样的?
  • 我们能否推断出博弈中什么行为应该被选择?
如果所有博弈者都知道,所有博弈者是理性的,你可以把这个如果你知道,我知道,你知道,我知道——反复进行下去。这听起来挺荒谬,但这在理解上是一个重要概念。我们可以运用这一整套逻辑用来分析均衡,以及做一些其他的事情

汇总:

在这里插入图片描述

  • 对于严格劣策略:代表其他所有策略总是比这个策略更优秀,它永远不会成为最优回应best reply
  • 在任何情况下总有别的策略更好,因此,我们把严格劣策略从博弈中剔除
  • 重复迭代的意思是:我们剔除它们,得到了一个更简单的博弈,然后再做同样的事情。现在可能又有了一些策略是严格劣势的,在这个简化的博弈中博弈者永远不会采取它们,因此我们再把它们剔除,循环反复,最后给我们了一些预测。当博弈者理性 他们也认识到其他博弈者理性时是合乎逻辑的结果 ,这些策略就会在这个子博弈中。
  • 进行这个过程的术语称作严格劣策略重复剔除
  • 用规范符号来表示为下图

在这里插入图片描述

  • 博弈者I的策略 a i
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值