CS269I:Incentives in Computer Science 学习笔记: Lecture3 Strategic Voting(巧妙的投票)

本文探讨了计算机科学中投票的应用,如排序融合、众包中的权重投票和参与式民主决策。重点介绍了几种投票规则,如多数决、简单多数、排名选择投票和Borda计票,以及Gibbard-Scatterthwaite定理和Arrow不可能性定理。文章还提及单峰偏好下的防策略规则作为特例。
摘要由CSDN通过智能技术生成

Lecture3 Strategic Voting(巧妙的投票)

1 Voting in Computer Science(背景介绍)

讨论:在讨论投票策略之前,我们要先了解一下,投票在计算机中到底有什么应用

(1)Rank aggregation(排序融合技术)

​ 在网页的推荐排序算法中,不同的heuristics(启发式)方法会给出不同的结果。例如,有的 算法是基于anchor text(锚文本),有的是基于链接结构,还有的是基于页面内容。那么,我 们很自然地希望在此基础上能够把各个方法得到的结果融合起来,就要用到投票了。这时候,我 们最终得到的顺序可能就会是不同的排序算法得到的结果进行“投票”后的票数顺序。在这个综合 排名中,排名越是靠前,在各种算法得到的结果中的得票数就都比较高。

(2)Crowdsourcing(众包)

​ 众包就是类似于算力网络的一个概念。比如,当你在google上进行人机验证,辨别哪些图片里 面含有某个物品的时候,你其实就称为了AI训练数据的一个“测试员”,你反馈的结果是对最终结果 的一个“投票”,而他们给出结果的正确性验证便相当于一个投票问题。

(3)Participatory Democracy(分享民主制)

​ 分享民主制是一种让所有人都参与政府的决策的制度,常常用于**capital expenditure(财 政支出)**的分配,让居民通过投票的方式来决定公共资源的流向。

2 Eample of Voting Rules
2.1 Formalism(形式化)

讨论:在了解投票的规则之前,我们首先要对投票这个过程进行一个建模。

模型:假设A是可供选择的对象集,那么每个投票者都会给出一个对A中对象的偏好排序L_i,则我们希望通过某个算法建立L_1,L_2,…,L_n|->L*/a*的一个映射。其中L*是指计算结果是一个排序,a*是指计算结果是一个winner(优胜者)。前者主要是用Rank aggretion中,而后者主要是用在Crowdsourcing中。

讨论:那么,我们的投票和之前讨论过的匹配有什么样的关系呢?简单来说,在匹配中,自己的结果与他人是无关的,每个人独享一个匹配结果;而在投票中,得到的结果是公共的,被所有人共享。

2.2 Majority Rule(少数服从多数原则)

模型:这个投票规则适用于|A|=2的情况。此时,只有两个候选人a,b,我们令票数多的候选人获胜;若是平局,则使用简单的方法打破它,例如,抽签。

性质:这个规则显然具有防策略性。这是因为,你上报的虚假偏好只能让结果向不利于你的一方偏移。

2.3 Plurality Rule(简单多数原则)

讨论:如果|A|≥3,显然,如果有一个候选人a的得票超过50%,则他必然获胜,但如果不是呢?

模型:在简单多数原则中,我们这样规定:如果一个人最喜欢对象a,则记为他给a投了一票,获得票数最多者获胜。也就是说,每个人只能给一个候选人投一票。

性质:令人沮丧的是,这个规则是不防策略的。例如,在美国大选中,你最支持的人既不是特朗普,也不是拜登,而他必然不可能当上总统,既然如此,你还不如把票投给拜登或特朗普中和你的政见最接近的一个。

2.4 Ranked-Choice Voting(优先选择投票)

别称:Single-Transferable Vote(可转移单票制);Instant-runoff Vote(排序复选制)

模型:每个人给出所有候选人的一个偏好排序,之后:

​ 循环(直到只剩两个人){

​ 若获得第一名最多的人超过50%,那么他直接获胜,break;

​ 否则,去掉获得第一名最少的人,继续循环}

性质:有限选择投票也不是防策略的,证明留作习题。不过,从直觉来看,你也能感到,你有时候可 以通过策略在开始阶段淘汰你最喜欢的人的对手。

2.5 The Borda Count(Borda计票)

模型:每个人给出偏好排序的时候获得一些权重,例如,在排序中获得第一名记|A|票,第二名记|A|-1票,…,第|A|名记1票,然后按照各个候选人获得的票数给出最终排序

讨论:通过这种加权的方法进行的投票称为scoring/ positional rule. 例如,简单多数原则就是这种规则的一个特例:相当于给第一名记1票,剩下的人记0票。

3 The Gibbard-Scatterthwaite and Arrow Impossibility

讨论看起来似乎所有比较复杂的投票规则都不防策略,这是否是一种巧合?

题目中提到的定理证明了,这并不是一种巧合。事实上,不平凡的防策略的投票机制是不存在的。

其中,平凡的定义是:

(1)dictator(独裁):有一个人(独裁者)i的意见被唯一地采纳

(2)duple(双选):仅有两个候选人可供选择,并且进行少数服从多数原则

定理:(Gibbard-Satterthwaite Theorem任意一种有三个以上候选人的防策略投票规则必定为独裁

这个定理实际上是一个更加著名的定理——阿罗不可能性定理的推论

定理:(Arrow‘s Impossibility Theorem)当在投票中包含三个及以上的选择时,不存在满足以下性质的规则:

(1)无独裁

(2)Unanimity(全体同意):如果所有人都喜欢a胜过b,则这种规则返回的结果中必须满足a胜过b

(3)IIA(不同选择之间相互独立):对于任意两个候选人a,b,这种规则返回的结果中a和b的关系必须仅与每个人提交的偏好排序中a和b的偏好排序相关。简而言之,假如有k个人认为a>b,t个人认为b>a,则最终a是否大于b仅与k,t的值相关,而与每个人给出的排序中a,b之间有多少个人无关。

讨论:IIA假设的合理性有着相当的争议。例如,简单多数原则和Borda计票都不满足IIA。

4 A Tractable Special Case:Single-Peaked Perference(一个简单的特殊情况:单峰偏好)

讨论:虽然一个防策略的投票规则被证实是不可行的,但是,我们可以另辟蹊径,寻找一些其他模型。在这一节我们会介绍一个相当有趣的防策略规则。

概念:不妨设每个人都有一个可以在区间[0,1]上表示的政治倾向值,例如,0代表保守,1代表激进。

现在,我们假设每个人的政治倾向具有单峰性——即,第i个人的政治倾向是x_i,则候选人y距离x_i越近,这个人对这个候选人的偏好就越高。

规则:所有投票者提供一个倾向值x_i,最后取x_1,…,x_n的中位数即可。

分析:如果取平均数的话可就不是防策略的了——如果你预先得知别人的结果会偏向左边,那么你当然会报出你的偏好偏右的值,而不是你的偏好。

但是,在中位数中,如果一个人i希望结果y移向他的偏好x,那么他上报的就应该是与x在y异侧的值z,但是事实上报z只会让结果更加偏离他的偏好。因此,每个人都有动力保持诚实。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值