『深度學習與圍棋遊戲』筆記 1

最近,搞到一本書 Deep Learning and the Game of Go 。
歐美書商好像有種習慣,科技方面尤其編程相關的電子書,銷售一段時間後會公開放到網上,供人免費下載。這本書就來源於此。
估計,有社會資本支持書商的善舉。希望國內資本雄厚的企業,向西方學習,鼓勵支持國內書商也這樣做。

這本書分為3篇14章及5個附錄。

第一篇:基礎

第1章, 簡明扼要地介紹人工智能、機器學習、深度學習。
第2章, 介紹圍棋規則。
第3章, 用Python實現你第一個圍棋機器人,棋力很弱。

第二篇:三項主要技術

它們是搜索樹、神經網絡、強化學習。AlpahGo使用它們效果很好。

搜索樹
第4章,涉及最大最小值搜索、alpha­-beta 剪枝、蒙特卡羅搜索。

神經網絡
第5章,神經網絡入門。
第6章,用 Keras 和卷積網絡處理圍棋棋譜。
第7章,用業餘高手的棋譜訓練深度學習網絡,並指出此技術的局限。
第8章,介紹與人對弈的接口界面,和與其他機器人對弈的本地機或服務器佈置設置。

強化學習
第9章,圍棋強化學習入門。
第10章,強化學習的梯度策略。
第11章,強化學習的估值方法。用於選擇棋盤落子點位。
第12章,介紹強化學習的Actor-Critic方法,用於預估棋盤點位的長久價值,以選擇下一步棋。

第三篇:建造近似 AlphaGo 的應用

第13章,上述第4-11章是建造 Alpha Go 的數學、技術原理。
第14章,介紹 AlphaGo Zero。

附錄:

附錄 A, 數學基礎,涉及線性代數和微積分基本知識,以及如何用 NumPy 對其運算。

附錄 B, 後向傳播算法,解釋大多數神經網絡學習程序的數學原理細節。

附錄 C, 與深入學習下圍棋相關的圍棋程序和服務器。

附錄 D, 使用 Amazon 云服務器訓練、部署你的機器人。

附錄 E, 將你的機器人提交 Online Go Server (OGS), 與世界各地的棋手對弈,測試你的機器人。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值