博弈论与计算机科学,算法博弈论的一点感想和介绍

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

境选择有利于自身的操作策略并实现利益的最大化,这些策略之间最终达到一种相互制约的均衡状态。在达到的各种均衡状态中,有些是系统应用设计者所希望看到

的,有的则恰恰相反。博弈论研究这些均衡状态的特性以便于区分选择,而机制设计则通过制定实体需遵守的交互机制,促使实体在自身利益驱动下选择设计者期望

的策略,实现符合设计目标的系统总体均衡态。

弈论将实体间的相互操作看作是一个博弈,每个博弈参与者依据系统设计者事先定义好的规则操作,在博弈结束时获得一定收益。博弈可以分为静态博弈和动态博

弈,也可以分为完全信息博弈和非完全信息博弈,还可以分为合作博弈与分合作博弈。在非合作博弈中,实体用户之间没有签约协议或存在协作,在合作博弈中,实

体间先协同获得最大的团体利益,再将团体利益分配到每个个体实体,在利益分配时会设计到公平问题等以保持团体的稳定。当前研究中较多的采用非合作博弈,从

合作博弈的角度出发的研究并不太多。

实体间选择策略达到相互制约的一种平衡状态时,就实现了某种均衡。研究最多的均衡态包括占优均衡和纳什均衡,占优均衡指每个人的选择策略都是占优策略而形

成的一种均衡,占优策略是指不管他人选择何种策略,博弈者都有一个最大化自己收益的最佳策略。纳什均衡是指当其他博弈者的策略不变时,单方改变自己的策略

时不能增加自己的收益。占优均衡一定是纳什均衡,反之则不一定。

比博弈论对博弈均衡态的分析而言,机制设计的目的,是研究如何设计一个博弈机制,实现期望的社会选择。社会选择是指整个社会群体性的选择结果,这个结果是

由诸多独立博弈者通过表达各自的偏好而聚集得出的,社会选择的结果会反过来影响每个独立博弈者的收益。比方在政治选举时,每个选民表达自己的意愿偏好,选

择一位候选者当选,所有选民的偏好聚集在一起共同决定了哪位候选者可以当选,候选者上任以后实施的政策翻过来会影响到选民的切身利益。

制设计中的一个重要问题就是如何设置恰当的机制,使每个博弈者显示自己的真实私有偏要,因为有的博弈者为了最大化自身利益而隐瞒自身真实偏好,或者通过策

略性的显示偏好而操纵社会选择的结果。一般的,需要通过某种激励策略实现这个目的,如果一种机制能够获得博弈者的真实信息并能够防止博弈者的策略性操纵,

这种机制被称作真实机制,也被叫做激励相容(incentive compatible)机制或防护策略(strategy-proof)

机制。需要注意的是,博弈者的最终收益的组成,若采用准线性的收益形式,最终收益等于初始收益与获得报酬的两者之和。通常设计的机制包括社会选择函数与实

体支付函数两部分,机制的设计就是通过适当的构造这两个函数,使机制满足一些所需要的特性,如实体只有在报告真实信息时才能获得最大最终收益的真实机制特

性。

真实机制可以被用作获得用户的真实意图,在一些计算机应用需要具有此特性的机制时,就应该应用机制设计的方式予以实现。本课题拟用机制设计方法解决信任模型中,推荐者不给出自己真实私有信任值的问题。

在机制设计中多用到的均衡态叫做事后纳什均衡(ex-post Nash equilibrium),是指在不完全信息博弈当中,每个博弈者都有内在状态作为私有信息,该私有信息与显示策略共同决定采取的行为,该行为可以被其他博弈者观察到,事后纳什均衡是指当仅知道其他所有博弈者的显示策略时,博弈者比较依据自身真实私有状态所显示/执行的行为,与隐瞒自身真实私有状态所显示/执行的行为,前者的收益更大。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值