博弈论与计算机,《黑 | 科技》| 人类的博弈论,计算机来背锅

原标题:《黑 | 科技》| 人类的博弈论,计算机来背锅

b027f45e7d88c4a75752ef2f45fa8a31.gif

一次Dota2人机大战,人类终于败下阵来,花了一个月时间,人工智能系统从几乎不敌高排名选手到击败顶级职业选手,并还在升段中。对于DOTA2人工智能训练的结果表明,如果计算够充分,自我对练可以将机器学习系统的性能从远低于人类的水平推向超越人类。

为什么人类想尽了办法,让机器打败自己,这里面的逻辑你有想过吗,其实背后人类下着一盘大旗,博弈无处不在。

本期内容将由斑马为你分享

《黑 | 科技》第八章:

计算博弈

除了对策、合作、资源优化、数据模型算法

还能带来和谐世界吗?

真正的人工智能是什么样的?

肯定不是仅能识别脸、看图、写字、说话

而是如孔明神机妙算

机制设计(Mechanism Design)

第二价格拍卖

(Second-price Auction)

谷歌一年要举行几万亿次的广告拍卖,提到拍卖,大多数人首先想到的也许是艺术品,广告位有什么好拍卖的?正是有拍卖机制的存在,才能让合适的广告位被合适的广告商买走。

6e6a899bfcfca39a8e12e370015247cc.png

a8a93edaad2f049faba508a306f345ab.png

a7baea85966c9779df932850ca14dadd.gif

99b6a66255349662cb7bf220d4d6fafa.png

只需要将第一价格拍卖改为第二价格拍卖(Second-price Auction)即可:报价最高的买家获得商品,但是只支付第二高的价格。

广义第二价格拍卖

(Generalized Second-price Auction)

谷歌所采用的广告竞拍正是基于第二价格拍卖。不同于一般的商品拍卖,广告拍卖(尤其是搜索结果的广告拍卖)有不止一位的拍卖赢家。比如当我们搜索手机的时候,谷歌会返回一系列的搜索结果,比如第一位是苹果手机,第二位是手机,第三位是小米手机等。广告也是如此:在用户搜索手机之后,谷歌可能会返回给用户三四个广告。

7b0ca185d105a71ba1f1ebce95f5e686.gif

Revelation Principle(揭示原理)与VCG

不论我们有一个多么复杂尔虞我诈的机制,这个机制在结果上总是等价于另一个机制,而在另一个机制中每个人都会真是地揭示自己的想法。

对于拍卖来说,VCG机制就是一种非常通用的令人诚实的拍卖机制。

40ae1c446b9d42ef97af946886cc8eb4.gif

加入靖王受霓凰郡主邀请演电视剧,靖王对片酬的心理价格是1100元一集,我们用机制X代表靖王直接和郡主讨价还价的机制,比如靖王说:“我要1100元一集。”郡主说:“太贵了,1000元吧。”靖王说:“好吧,那我勉为其难接受了。”但是靖王不好意思直接跟郡主提,于是找来梅长苏做经纪人,梅长苏为了帮助靖王实现1000元一集的心理价位,于是跟郡主说,靖王的片酬是2000元一集,但是给你个友情价,1100元一集就可以啦,最后郡主还价,还是以靖王的心理价位1000元成交,这个我们用机制Y表示。这里我们看到,其实X和Y的利益时一致的,是等价的。但是在X中,靖王说的虚假的想法“1100元”,而在Y中,靖王直接告诉梅长苏真实的想法“1000元”。对于靖王而言,他从“说谎”变成了“真实揭示”。

深谙博弈论的AI

就像真实的人类

不再有呆板套路,而是灵活的谋略

展望未来

如果将现在如日中天的机器学习比作黑箱、黑魔法,那么我希望未来的计算博弈是透明和光明的白魔法。

e418697decd1765b71ac60a0c8d38117.gif

目前AI的最大的问题就在于死板,缺乏随机性。主要是因为目前这些AI都源自于组合博弈论(Combinatorial Game Theory),代表作就是击败卡斯帕罗夫的AI。

博弈的根本就是除了站在自己的角度去考虑问题,也会站在别人的角度去考虑问题。正式如此,才有纳什均衡、斯塔克伯格策略以及VCG机制,而不是简单的最优化自己关心的结果,毫不在意别人的感受。

日常生活中,你使用过博弈论吗?

或有哪有博弈的经历呢?

戳链接查看更多

165698520_674326

165698520_674326

165698520_674326

责任编辑:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值