笔记:人类的胜利——人工智能、AlphaGo杂谈

2016年——一个特殊的年份

2016年是机器智能历史上一个具有纪念意义的年份,它是一个时代的结束,也是一个新时代的开始。

  • 1956年,人工智能概念提出。
  • 2016年,人工智能概念60周年,提出此概念的最后一名科学家辞世,AlphaGo战胜人类。

    谈谈 AlphaGo

    计算机之所以能战胜人类,是因为机器获得智能的方式和人类不同,他不是靠逻辑推理,而是靠大数据和智能算法。

    • 在数据方面,AlphaGo采用了即使碗盘围棋高手的对弈数据来进行训练,这使他获得所谓“智能”的原因。
    • 在计算方面,AlphaGo 采用了上万台服务器来训练下期模型,并且让不同版本的 AlphaGo 相互对弈了上千万盘。

下棋策略,AlphaGo里面有两个关键技术:

  1. 把棋盘上的当前状态变成一个获胜的概率模型:这个模型没有任何人干预,完全是靠大数据训练出来的。
  2. 启发式搜索算法:蒙特卡洛树搜索算法(Monte Carlo Tree Search),它能将搜索空间限制在非常有限的范围内。

虽然AlphaGo训练用了上万台服务器,但在实际比赛中,仅用了几十台服务器(1000多个CPU+100多个GPU)。围棋的状态空间比国际象棋高出很多个数量级,但是AlphaGo的计算能力和深蓝相比,并没有多少提升,这里面靠的是搜索算法有想性的提升。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

许野平

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值