CS269I：Incentives in Computer Science 学习笔记： Lecture3 Strategic Voting（巧妙的投票）

ldc1513

于 2021-02-08 02:12:32 发布

阅读量532

点赞数

分类专栏：学习笔记文章标签：算法博弈论

原文链接：http://timroughgarden.org/f16/f16.html

版权

学习笔记专栏收录该内容

43 篇文章

订阅专栏

本文探讨了计算机科学中投票的应用，如排序融合、众包中的权重投票和参与式民主决策。重点介绍了几种投票规则，如多数决、简单多数、排名选择投票和Borda计票，以及Gibbard-Scatterthwaite定理和Arrow不可能性定理。文章还提及单峰偏好下的防策略规则作为特例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Lecture3 Strategic Voting（巧妙的投票）

1 Voting in Computer Science（背景介绍）

讨论：在讨论投票策略之前，我们要先了解一下，投票在计算机中到底有什么应用

（1）Rank aggregation（排序融合技术）

在网页的推荐排序算法中，不同的heuristics（启发式）方法会给出不同的结果。例如，有的算法是基于anchor text（锚文本），有的是基于链接结构，还有的是基于页面内容。那么，我们很自然地希望在此基础上能够把各个方法得到的结果融合起来，就要用到投票了。这时候，我们最终得到的顺序可能就会是不同的排序算法得到的结果进行“投票”后的票数顺序。在这个综合排名中，排名越是靠前，在各种算法得到的结果中的得票数就都比较高。

（2）Crowdsourcing（众包）

众包就是类似于算力网络的一个概念。比如，当你在google上进行人机验证，辨别哪些图片里面含有某个物品的时候，你其实就称为了AI训练数据的一个“测试员”，你反馈的结果是对最终结果的一个“投票”，而他们给出结果的正确性验证便相当于一个投票问题。

（3）Participatory Democracy（分享民主制）

分享民主制是一种让所有人都参与政府的决策的制度，常常用于**capital expenditure（财政支出）**的分配，让居民通过投票的方式来决定公共资源的流向。

2 Eample of Voting Rules

2.1 Formalism（形式化）

讨论：在了解投票的规则之前，我们首先要对投票这个过程进行一个建模。

模型：假设A是可供选择的对象集，那么每个投票者都会给出一个对A中对象的偏好排序L_i，则我们希望通过某个算法建立L_1,L_2,…,L_n|->L*/a*的一个映射。其中L*是指计算结果是一个排序，a*是指计算结果是一个winner（优胜者）。前者主要是用Rank aggretion中，而后者主要是用在Crowdsourcing中。

讨论：那么，我们的投票和之前讨论过的匹配有什么样的关系呢？简单来说，在匹配中，自己的结果与他人是无关的，每个人独享一个匹配结果；而在投票中，得到的结果是公共的，被所有人共享。

2.2 Majority Rule（少数服从多数原则）

模型：这个投票规则适用于|A|=2的情况。此时，只有两个候选人a，b，我们令票数多的候选人获胜；若是平局，则使用简单的方法打破它，例如，抽签。

性质：这个规则显然具有防策略性。这是因为，你上报的虚假偏好只能让结果向不利于你的一方偏移。

2.3 Plurality Rule（简单多数原则）

讨论：如果|A|≥3，显然，如果有一个候选人a的得票超过50%，则他必然获胜，但如果不是呢？

模型：在简单多数原则中，我们这样规定：如果一个人最喜欢对象a，则记为他给a投了一票，获得票数最多者获胜。也就是说，每个人只能给一个候选人投一票。

性质：令人沮丧的是，这个规则是不防策略的。例如，在美国大选中，你最支持的人既不是特朗普，也不是拜登，而他必然不可能当上总统，既然如此，你还不如把票投给拜登或特朗普中和你的政见最接近的一个。

2.4 Ranked-Choice Voting（优先选择投票）

别称：Single-Transferable Vote（可转移单票制）；Instant-runoff Vote（排序复选制）

模型：每个人给出所有候选人的一个偏好排序，之后：

循环（直到只剩两个人）｛

若获得第一名最多的人超过50%，那么他直接获胜，break；

否则，去掉获得第一名最少的人，继续循环｝

性质：有限选择投票也不是防策略的，证明留作习题。不过，从直觉来看，你也能感到，你有时候可以通过策略在开始阶段淘汰你最喜欢的人的对手。

2.5 The Borda Count（Borda计票）

模型：每个人给出偏好排序的时候获得一些权重，例如，在排序中获得第一名记|A|票，第二名记|A|-1票，…，第|A|名记1票，然后按照各个候选人获得的票数给出最终排序

讨论：通过这种加权的方法进行的投票称为scoring/ positional rule. 例如，简单多数原则就是这种规则的一个特例：相当于给第一名记1票，剩下的人记0票。

3 The Gibbard-Scatterthwaite and Arrow Impossibility

讨论：看起来似乎所有比较复杂的投票规则都不防策略，这是否是一种巧合？

题目中提到的定理证明了，这并不是一种巧合。事实上，不平凡的防策略的投票机制是不存在的。

其中，平凡的定义是：

（1）dictator（独裁）：有一个人（独裁者）i的意见被唯一地采纳

（2）duple（双选）：仅有两个候选人可供选择，并且进行少数服从多数原则

定理：（Gibbard-Satterthwaite Theorem）任意一种有三个以上候选人的防策略投票规则必定为独裁

这个定理实际上是一个更加著名的定理——阿罗不可能性定理的推论

定理：（Arrow‘s Impossibility Theorem）当在投票中包含三个及以上的选择时，不存在满足以下性质的规则：

（1）无独裁

（2）Unanimity（全体同意）：如果所有人都喜欢a胜过b，则这种规则返回的结果中必须满足a胜过b

（3）IIA（不同选择之间相互独立）：对于任意两个候选人a，b，这种规则返回的结果中a和b的关系必须仅与每个人提交的偏好排序中a和b的偏好排序相关。简而言之，假如有k个人认为a>b，t个人认为b＞a，则最终a是否大于b仅与k，t的值相关，而与每个人给出的排序中a，b之间有多少个人无关。

讨论：IIA假设的合理性有着相当的争议。例如，简单多数原则和Borda计票都不满足IIA。

4 A Tractable Special Case：Single-Peaked Perference（一个简单的特殊情况：单峰偏好）

讨论：虽然一个防策略的投票规则被证实是不可行的，但是，我们可以另辟蹊径，寻找一些其他模型。在这一节我们会介绍一个相当有趣的防策略规则。

概念：不妨设每个人都有一个可以在区间[0,1]上表示的政治倾向值，例如，0代表保守，1代表激进。

现在，我们假设每个人的政治倾向具有单峰性——即，第i个人的政治倾向是x_i，则候选人y距离x_i越近，这个人对这个候选人的偏好就越高。

规则：所有投票者提供一个倾向值x_i，最后取x_1,…,x_n的中位数即可。

分析：如果取平均数的话可就不是防策略的了——如果你预先得知别人的结果会偏向左边，那么你当然会报出你的偏好偏右的值，而不是你的偏好。

但是，在中位数中，如果一个人i希望结果y移向他的偏好x，那么他上报的就应该是与x在y异侧的值z，但是事实上报z只会让结果更加偏离他的偏好。因此，每个人都有动力保持诚实。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。