CS269I:Incentives in Computer Science 学习笔记 Lecture 18: Prediction Markets(预测市场)

Lecture 18: Prediction Markets(预测市场)

1 Markets for Information(信息市场)
1.1 Uncertian Events(非确定事件)

假设我们对不确定的事件感兴趣,例如勇士队是否会赢得2017年NBA冠军,下一届总统选举的获胜者是共和党人还是民主党人,或者2017年是否会 有记录以来最热的一年。 这些事件中的每一个都是不确定的,但最终我们将知道它们是否发生。 也就是说,这些不确定事件的结果最终是可以验证的。 (类似于上一堂课上半部分评分规则的设置,但与下半年上主观评价的设置不同。)

预测此类事件是否会发生的最佳方法是什么? 例如,假设您必须预测一场体育比赛的获胜者(尽管对这项运动知之甚少)。 那么,最好的选择是向拉斯维加斯的博彩市场寻求帮助。 拉斯维加斯的赔率无法让您完全确定地预测任何事情,但是事实上即使是最优秀的专家也很难胜过博彩市场。 例如,在维加斯,多数击败少数和少数击败多数的次数基本上一样多。

1.2 The Iowa Electronic Markets(爱荷华电子市场)

如果投注市场能很好地预测体育赛事的结果,为什么不使用它们来预测其他不确定事件呢? 这正是爱荷华州电子市场(IEM)背后的想法,该市场自1988年以来一直致力于使用市场来预测总统,国会和州长选举的结果。

做法很简单。 如果IEM想要预测A或B这两个候选人中的哪一个将赢得选举,它将创建两个虚拟证券(类似于股票)。如果A赢得选举,购买第一个证券的人将得到$1,否则为0。如果B赢得选举,购买第二个证券的人得到$1,否则为0。

分析:如果您个人认为候选人A将以概率p获胜,那么显而易见的事情是,您可以在价格低于p(您的期望值为p)时购买第一只证券 ;在价格低于(1-p)(您的期望值为(1-p))的购买第二只。 每当证券价格分别高于p和1-p时,出售您拥有的股份(以获利)也是很有意义的。

我们的想法来源于把这两只证券的市场价格解释为市场关于这两位候选人赢得大选的可能性的信念。 例如,如果第一只证券以每股$0 .80的价格交易,那么我们可以解释为市场认为第一候选人有80%的获胜机会。 因此,市场有效地聚集了所有参与者的信念,并产生了“共识”预测。

另一种有用的证券类型是根据候选人获得票数的百分比进行支付的证券。 例如,如果候选人A获得55%的选票,则相应证券每股得到的收入将为$ 0.55。 在这里,证券的市场价格可以解释为市场对候选人投票份额的预测。

任何人都可以注册IEM并立即开始交易。 您可能会好奇:这不就是在线赌博吗?但是, IEM利用商品期货交易委员会(CFTC)发出的无异议函(no-action letter)规避了监管,该信许可了IEM的行为,理由是:(i)IEM是非营利性的,仅用于研究目的(ii)赌注很小(每个交易者的最高限额为500美元,交易者的数量通常在几千人左右)。

1.3 Legality Issues(合法性问题)

长期以来,IEM是唯一允许美国居民使用真实货币进行交易的预测市场。当然,还有几个基于IEM的游戏货币预测市场(交易以虚拟货币进行);由于没有真钱易手,这些市场都不会面临监管问题。好莱坞证券交易所会预测奥斯卡奖得主和票房收入之类的事件,直到今天仍然很受欢迎。
尽管有许多著名的经济学家(包括发现了Arrow不可能定理[1]的Arrow)倡导建立合法的真实货币预测市场,但是迄今为止还没有一个人成功过。 InTrade是位于爱尔兰的真实货币预测市场,该市场创立于2001年。2012年,美国政府禁止美国居民使用InTrade,此后不久,该公司就关门大吉。除IEM之外,美国居民目前可以合法交易的(唯一)另一个真实货币预测市场是由位于新西兰的公司PredictIt经营的。他们也收到了CFTC的无异议信。这是因为他们效仿了IEM的模式:一个交易者最多只能在PredictIt上花费850美元,并且每个市场最多允许5000个交易者。

1.4 Accuracy(准确性)

预测市场并不是预测不确定事件的唯一方法。例如,要预测某个候选人的选票比例,一个久经考验的方法是民意调查——询问一群随机的人,问他们打算投票支持谁,然后以此推广到全部人上。从历史上看,预测市场通常会具有比民调更准确的预测(尤其是在选举前的最后几天)。然而,一个悖论是,问人们他们认为别人会做什么事实上比问他们自己会做什么更有效。(所以理论上说民调应该比预测市场强)更何况,IEM中的交易者不是特别有代表性的群体(例如,有大量爱荷华州人),这中反差便更令人印象深刻。

然而,对于预测市场而言,2016年并不是一个好年头。 IEM预测希拉里·克林顿有80%的概率赢得大选,这与许多民意测验相似。但是,结果如何,我们都心知肚明。

智能投票和民意调查技术似乎在预测市场上具有相当的竞争力,至少在诸如总统选举之类的重大事件上更是如此。有趣的是,我们可以看看,研究人员是否可以从2016年大选中汲取教训,以建立更好的预测市场。

2 Continues Double Auctions(连续双重拍卖)

那么,爱荷华州电子市场如何运作? 事实证明,他们使用与华尔街(即纽约证券交易所)几乎完全相同的交易机制,称为连续双重拍卖。 在CDA中,交易者可以随时提交购买或出售的请求(order)。这种请求包含三个要素:

  1. 价格(对于买入者来说,是最大的可接受价格;对于卖出者来说,是最小的可接受价格)
  2. 买入/卖出的最大数量
  3. 交易日期(在本讲中没什么作用)

交易以贪婪的风格来执行——只要有一个买入单的价格至少等于某些卖出单的价格,就执行交易。 通过一个例子,我们可以很好地说明完成次操作的各种细节。下面是一些订单:

  1. 购入10股,每股0.5

    【没有出现交易,因为还没有人卖出】

  2. 购入5股,每股0.6

    【同上】

  3. 卖出10股,每股0.7

    【没有出现交易,因为没人买得起】

  4. 卖出10股,每股0.5

    下列交易被触发:

    (a)有两个未完成的买入单,其价格至少等于此新卖出单的价格。应该进行交易,但是谁优先呢?答案是价格较高的买单(即订单2)。因此,将5股股份从订单4中的卖方转移到了订单2中的买方。
    (b)由于买方愿意支付最高0.6的价格而卖方愿意出售最低0.5的价格,因此价格可以随意确定。在IEM中,规定使用更早的订单中的价格。这意味着这5股将以0.6的价格出售,对卖方有利。
    (c)由于订单2(5)中所需的股份数量少于订单4(10)中所提供的股份数量,因此仅部分执行了卖单。减少的卖出定单(价格为0.5时最多5股)将自动重新提交到市场,以替换原始定单。
    (d)现在,卖出订单4中的剩余5股以买入订单1中的价格出售给买方,每股价格为0.5。买单仅部分执行,减少的买单(最多5股,价格最高为0.5)将自动重新提交到市场,以替换原始订单。

  5. 买入5股,每股0.8

    【这个订单被匹配到订单3,由于3更早,所以售价为0.7,订单3中还剩下5股】

CDA的激励措施如前所述:合理的价格是,以低于自己对相应结果概率的估计的价格进行购买,并以更高的价格进行销售。

3 The Rise, Fall and Rise of Prediction Markets(预测市场的兴与衰)

在20世纪,IE还是一种只有政治呆瓜才知道的奇怪事物。但是, 本世纪初,两次大事引起了主流媒体的广泛报道(一种好,一种不好),并大大提高了预测市场的知名度。

3.1 The Policy Analysis Market(政策分析市场)

第一个事件是涉及政策分析市场(PAM)的丑闻。这是由国防部研究局(DARPA)资助的一项试点计划,目的是利用预测市场来辅助政治和军事决策。本来的计划是建设两个不同的预测市场。一个是秘密市场,仅向在各种情报机构(中央情报局,联邦调查局,国家安全局等)工作的一小部分人开放。这个市场有可能被用来预测高度机密的事件(例如美国是否可以在其他国家成功发动政变)。该市场的目标是使不同的情报机构更容易共享信息,从而规避通常的政治和领土障碍。 (DARPA计划在9/11之前就获得了一些资金,但是在9/11之后,每个人都想要这样的一个市场。)另一个市场则将向任何人开放,可能用于预测中东经济政治相关的事件(例如,某个国家的现任领导人是否会在今年年底继续执政?)。

2003年中,两名美国参议员召开新闻发布会公开谴责PAM,称其为“在恐怖主义上下注”的令人反感的机制。这个故事迅速传播开来,几乎所有媒体的报道都是负面的。新闻发布会后不到24小时,DARPA就取消了该计划的拨款,而负责DARPA的部门主管(约翰·波因德斯特)在一周之内辞职。预测市场的未来看起来并不乐观。

3.2 The Wisdom of Crowds(群众的智慧)

第二件事是2004年出版的《群众的智慧》,这是James Surowiecki的畅销书。本书极力主张更广泛地使用预测市场,尤其是在公司内部。

这个建议的先驱者是1990年代惠普的内部预测市场(仅对惠普员工开放)。他们用这个市场来预测未来的打印机销售。结果令人鼓舞,市场在8次中有6次的表现优于内部专家的预测。更笼统地说,我们可以使用内部预测市场来处理与公司相关的各种事件,例如某个项目是否会在预期的截止日期之前交付,其主要目标是使通常不会互相交谈的不同组之间的信息共享成为可能。

偶然或不偶然地,许多公司开始使用内部预测市场(包括Google,Microsoft等),通常都使用游戏币。并且,目前出现了一些专门建立此类市场的公司(例如ConsensusPoint和培 Cultivate Labs)。这些内部预测市场中的许多使用的机制都不同于连续双重拍卖(接下来讨论)

4 Market Scoring Rules
4.1 Motivation

在本节和下一部分中,我们将介绍两个与连续两次拍卖不同的等效的运行预测市场的机制。为什么不总是使用CDA? CDA往往在交易者很多的“密集”市场中运作良好,但在“稀薄”市场(交易者很少)或“非流动性”市场(“买卖差价”很大)中却不能很好地工作。最高未完成买单和最低未完成卖单之间有很大的差距)。在一个极端的情况下,想象只有一个交易者,他拥有极其准确的信息,但 CDA无法通过市场价格获取此信息——没有其他交易者,就不会有任何交易,因此也就没有“当前市场价格”(然而CDA的关键就是市场价格,通过市场价格才能预测事件期望)。
因此,在弱势市场进行交易的一种方法是使用“自动做市商”。对我们来说,这意味着市场在任何时候都会发布一些价格,并且总是乐于以当前价格买卖股票。 (大概是当交易者买入股票时价格会上涨,而当他们卖出股票时价格会下跌。)然后,即使只有一名交易者,该交易者也可以通过买卖股票来移动市场价格以匹配其价格,从而自发地报告所有信息。

4.2 Definition(定义)

那么,如何与自动做市商一起实现预测市场呢? 关键思想是利用上讲中介绍的严格正确的评分规则。 毕竟,我们的假设是,所预测的事件最终是可以验证的(使用评分规则需要的条件)。

计分规则是为单个参与者设计的,而预测市场可以有很多。如何将计分规则扩展到多人游戏? 一种想法是为每个玩家使用单独的计分规则。 但这有两个问题:(i)如果您收到来自不同参与者的相互矛盾的信念,那么您将不得不弄清楚如何将它们汇总到一个预测中(这应该是预测市场的工作); (ii)必须向每位玩家分别支付一定数量的款项,并支付一定数量的款项,比较麻烦。

因此,最终解决这个问题的方法是:设计一个被所有玩家所共享的单件评分规则。这个主意被称为“market scoring rule(市场评分规则)”

Market Scoring Rule:

  • 令S为一些严格正确的评分规则

  • 初始化p^0为一个在结果集X上的概率分布。(例如,均匀分布)

  • 在每一步t=1,2,3,…

    ——任意一个玩家可以把p^{t-1} 更新为一个任意的概率分布p^t

  • 在最终结果i∈X揭晓之后,做出第t个更新的玩家得到的支付为S(p^t ,i)-S(p^{t-1},i)

因此,玩家的报告改变了当前的预测结果。如果预测结果因此变好,玩家就会受到奖励;如果变差,则受到惩罚。玩家可以通过不更改当前信念来保证自己获得0的奖励(即,设置pt = pt-1)。
对市场评分规则的最终预测只是报告的最后一个分布似乎很奇怪。但这类似于CDA中证券的市场价格如何仅取决于涉及该证券的最新交易的售价。预测市场的概率分布可能会随每份新报告而大幅波动,但实际上,它倾向于趋于稳定(因为随着其他人的预测信息的增加,不同参与者的信念趋于一致)。在我们将市场评分规则重新解释为第5节中的交易市场之后,这种直觉可能会更加清楚。

4.3 Bounded Financial Loss(受限财政支出)

我们接下来考虑在市场评分机制下的两个简单但重要的性质:

命题4.1:市场向所有的玩家支付的价格至多为S(pT,i)-S(**p0**,i)

证明:直接加起来然后裂项就行了。

例如,如果选取的S是对数评分规则(S(p,i)=pi,那么S(p^0,i) =-ln|X|,而最后的S(p^T,i)必为负数,因此总支付不超过ln|X|

因此,自动化的市场标记可能会亏损。 (这与保证不会亏损的CDA不同。)但是,有两个好消息:(i)命题4.1显示亏损受一个绝对常数限制(取决于| X |,该常数经常是 2),独立于玩家数量; (ii)如果收集到的信息很有价值,则可以期望为此付出代价。因此,在许多情况下,这种损失是可以接受的,经营预测市场是有意义的。

4.4 Strategic Isuues(策略问题)

下一个命题是弱化版本的诚实性。

命题4.2:假设:

  • 玩家是短视的(myopic),这意味着他们并不考虑他们未来行动的后果;
  • 或者:每个玩家只能以固定顺序交易一次。

那么,每个玩家的唯一最优选择就是报告自己的真实信念。

命题4.2是从(1)中的支付结果直接衍生出来的 :只要他认为自己的结果是正确的,那么他就有理由把结果改成自己的结果,以此来最大化自己的收益。

如果一个参与者的报告可以引起其他参与者更新其信念,那么当非短视者参与时,市场评分规则可能会带来多个策略性的问题(如果参与者可以多次报告)。从直觉来看,一个玩家的早期错误报告可能导致其他玩家的错误定价安全性,从而为该错误报告的玩家提供后来的好处。

例如,假设我们抛了两个硬币,爱丽丝可以看到第一个硬币的结果,鲍勃则可以看到第二个硬币。假设有一个证券,如果两个硬币都正面朝上支付1美元。假设第一个硬币是“背面”,而爱丽丝先走。如果她如实报告(即发生相关事件的机会为0%),则Bob不会采取任何措施。但是,假设爱丽丝通过报告相反的说法(即50%)误导了鲍勃。如果鲍勃(Bob)获得此报告(即假设爱丽丝看到“正面”),而他自己的硬币为“正面”,那么他将以100%的比例做出回应。但随后,爱丽丝可以报告正确的分配(0%),从而从市场评分规则中获得大笔收益(由鲍勃承担)。

最近的研究已经确定了所有玩家进行真实地报告构成一个均衡的玩家信息条件。参考:

Y. Chen, S. Dimitrov, R. Sami, D. M. Reeves, D. M. Pennock, R. D. Hanson, L. Fortnow,and R. Gonen. Gaming prediction markets: Equilibrium strategies with a market maker.Algorithmica, 58(4):930–969, 2010.

Y. Chen and B. Waggoner. Informational substitutes. In Proceedings of the 57th Annual Symposium on Foundations of Computer Science (FOCS), pages 239–247, 2016.

4.5 The Logarithmic Market Scoring Rule (LMSR)

当S取对数评分规则(或其平移/放缩)的时候,称为对数市场评分规则。一般公司内部的评分规则都会使用LMSR,而很多调查也使用LMSR。

5 Automated Market Makers(自动做市商)

5.1 Preliminaries

对于已经熟悉评分规则的人来说,市场评分规则是自然而然的,其财务损失和激励属性是透明的(命题4.1和4.2)。 但是,如果我们想保留参与者购买和交易股票而不是报告概率分布的连续两次拍卖的“外观”,该怎么办?

事实证明,市场评分规则可以作为自动做市商来实施,参与者可以通过买卖股票来隐式改变市场的预测。 我们将针对LMSR的特殊情况说明其实现。 由于自动做市商接受当前市价的任何买卖合约,因此定义市场归结为定义当前市价(根据过去发生的情况)。 我们考虑k个可能结果的集合X,每个结果都有一个证券。

我们使用πi(q)来表示第i只证券的当前市场价格。假设q的分量qj表示第j只证券当前已经售出的数量。需要保证下面两个条件:
π i ( q ) ≥ 0 , ∑ i = 1 k π i ( q ) = 1 \pi_{i}(\mathbf{q}) \geq 0,\sum_{i=1}^{k} \pi_{i}(\mathbf{q})=1 πi(q)0i=1kπi(q)=1
以保障市场的价格是良定义的。而且市场的价格暗示了最终的结果期望。

那么,假设一个玩家执行了交易z=(z1,…,zn),其中zi(正/负)表示购入/售出第i个证券的数量。那么,他应该支付的价格应该是:
∫ 0 z ∑ i = 1 k π i ( q + x ) d x \int_{0}^{z} \sum_{i=1}^{k} \pi_{i}(q+x) d x 0zi=1kπi(q+x)dx
评论:首先,请注意,当前价格π并未“锁定”——玩家购买或出售一些股票后,当前价格就会改变。 因此,总价格是通过对交易执行时市场价格进行路径积分来计算的。

其次,(4)中的积分是中的路径积分,而不是单变量积分。 路径积分通常取决于路径的选择(而不仅取决于其端点)。 对我们来说,路径依赖将是一个不得不考虑的事情,否则,就可以进行正向和反向的交易并赚钱——实际上就是“钱泵”。因此, 为确保路径独立性,根据Green定理,我们需要选择定价函数π,以便它是某些“成本函数” C的梯度C:Rk→R。这样,我们写出的积分可以简化为C(q+z)-C(q)。

5.2 Details

到目前为止的成果:定义基于交易的预测市场归结为定义在给定售出证券量下的市场价格π,而后者又归结为定义成本函数C(然后设置π=∇C)。

那么,我们如何选择C,以使参与者面临的激励与LMSR相同? 有一个系统地回答这个问题的方法(对于任何市场评分规则,不仅是LMSR),但为了简洁起见,我们将使用“猜测和检查”方法,以适当地考虑成本函数。

我们定义:
C ( q ) = ln ⁡ ( ∑ i = 1 k e q i ) C(\mathbf{q})=\ln \left(\sum_{i=1}^{k} e^{q_{i}}\right) C(q)=ln(i=1keqi)
因此,使用链式法则:
π i ( q ) = ∂ ∂ q i C ( q ) = e q i ∑ j = 1 k e q j \pi_{i}(\mathbf{q})=\frac{\partial}{\partial q_{i}} C(\mathbf{q})=\frac{e^{q_{i}}}{\sum_{j=1}^{k} e^{q_{j}}} πi(q)=qiC(q)=j=1keqjeqi

市场的最终描述非常简单,不需要记住任何多元运算:只需使用上面中的公式来跟踪市场价格,并以当前价格接受任何交易(买入或卖出), 交易总价格由C(q+z)-C(q)给出。

如所承诺的,πi总是满足上面的两个约束条件(非负和归一),因此可以解释为结果X上的概率分布。请注意,在碰到离散化误差之前,参与者可以通过适当地买卖股票来移动“市场”信念“π1(q),…,πk(q)。也就是说,玩家可以通过执行适当的交易来模拟针对市场得分规则的信念报告。 以下是对于LMSR与上面定义的市场之间的等价形式的正式声明:

定理5.1对于每个q,z使得q+z≥0,以及任意一种最终结果i,成立:

从交易q->q+z中的获益=在LMSR中将π(q)更新为π(q+z)的获益

证明

从交易q->q+z的获益:
z i ⏟ payoff of new shares  − ( C ( q + z ) − C ( q ) ) ⏟ cost of trade  , \underbrace{z_{i}}_{\text {payoff of new shares }}-\underbrace{(C(\mathbf{q}+\mathbf{z})-C(\mathbf{q}))}_{\text {cost of trade }}, payoff of new shares  zicost of trade  (C(q+z)C(q)),
根据C的表达式,为:
z i − [ ln ⁡ ( ∑ j ∈ X e q j + z j ) − ln ⁡ ( ∑ j ∈ X e q j ) ] z_{i}-\left[\ln \left(\sum_{j \in X} e^{q_{j}+z_{j}}\right)-\ln \left(\sum_{j \in X} e^{q_{j}}\right)\right] zilnjXeqj+zjlnjXeqj
同时,从π的更新汇总获得的收益:
KaTeX parse error: Undefined control sequence: \ at position 460: …\right)\right] \̲ ̲
证毕!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值