中国人工智能学会通讯——金融博弈下的价值学习 1.3 贝叶斯最优拍卖

1.3 贝叶斯最优拍卖

image

这是一个著名的Myerson最优拍卖的例子。第一步,Myerson的建议是,我们知道它的分布,怎么知道没有说,我们把它加进来,因为我们是学习这个价值分布。

大多数情况,在互联网的环境下,这个事情都是我们自己做的。在这里我们有一个报价,然后运用一个机制设计来决定卖给你什么,收多少钱。这里,虚拟报价是根据真实报价算出来的一个值。

这样的话,在Myerson拍卖里面它确定赢家在虚拟报价最高的一列,计算费用就等价于第二虚拟报价的赢家报价,这是一个非常简明扼要的方案。但是在互联网中,卖给你很多次以后,我知道你有一个底价,即虚拟报价等于0的那个就是底价。在贝叶斯最优拍卖里面也有这样一个值。

image

我们看看Myerson拍卖时怎么卖。

它的分布函数空间为[0,a] 1>a>0。

我们回去参考一下,或者是你相信我的话,虚拟报价是2x-a,当2x-a=0即x=a/2当只有一个人时,你的报价大于a/2就赢得报价,你的付费就是a/2。

image

这样我们可以算出来你的付费是多少,你的期望收益是多少。你的期望收益在这里算出来的是一个常数减去a/4。你的最优策略是什么?你把a设为0,最优策略的收益是3/8。但是你诚实报价时a=1,你的诚实收益是1/8,这样的话,拍卖者就被你欺骗了。

在一般的情况下,我们有这么两个阶段。第一个阶段呢,在经济学理论分析中,它强调逻辑原则,也就是刚才我们讲的Myerson拍卖,它是假设知道你的分布。但是今天我们看到,数据范式里非常强调数据,那么我们把这两个衔接起来就能发现以前的理论的弱点在哪里。

image

我们在这样一个均衡的情况下,刚才只讲了一个人的情况,如果是多个买家的情况,我们也可以得到一个最佳欺骗的分布。n趋向于无穷大时,a=1。也就是说,参与买卖东西的人很多时,我们会收敛到Myerson拍卖,卖家收入是得到真实报价的最优收入。这里有一点,卖家是对的,卖家要学习,学习以后能够得到最优拍卖,而买家要做strategy,结果得到自己2倍的真实报价最优收益。

今天我想讲的是最后一段,卖家要反复学习,买家要做strategy。

(本报告根据速记整理)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值