『深度學習與圍棋遊戲』筆記 1

最新推荐文章于 2020-05-12 11:14:51 发布

lawme

最新推荐文章于 2020-05-12 11:14:51 发布

阅读量583

点赞数

分类专栏： Alpha Zero Keras

Keras 同时被 2 个专栏收录

15 篇文章 1 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

最近,搞到一本書 Deep Learning and the Game of Go 。
歐美書商好像有種習慣，科技方面尤其編程相關的電子書，銷售一段時間後會公開放到網上，供人免費下載。這本書就來源於此。
估計，有社會資本支持書商的善舉。希望國內資本雄厚的企業，向西方學習，鼓勵支持國內書商也這樣做。

這本書分為3篇14章及5個附錄。

第一篇：基礎

第1章, 簡明扼要地介紹人工智能、機器學習、深度學習。
第2章, 介紹圍棋規則。
第3章, 用Python實現你第一個圍棋機器人，棋力很弱。

第二篇：三項主要技術

它們是搜索樹、神經網絡、強化學習。AlpahGo使用它們效果很好。

搜索樹
第4章，涉及最大最小值搜索、alpha-beta 剪枝、蒙特卡羅搜索。

神經網絡
第5章，神經網絡入門。
第6章，用 Keras 和卷積網絡處理圍棋棋譜。
第7章，用業餘高手的棋譜訓練深度學習網絡，並指出此技術的局限。
第8章，介紹與人對弈的接口界面，和與其他機器人對弈的本地機或服務器佈置設置。

強化學習
第9章，圍棋強化學習入門。
第10章，強化學習的梯度策略。
第11章，強化學習的估值方法。用於選擇棋盤落子點位。
第12章，介紹強化學習的Actor-Critic方法，用於預估棋盤點位的長久價值，以選擇下一步棋。

第三篇：建造近似 AlphaGo 的應用

第13章，上述第4－11章是建造 Alpha Go 的數學、技術原理。
第14章，介紹 AlphaGo Zero。

附錄：

附錄 A, 數學基礎，涉及線性代數和微積分基本知識，以及如何用 NumPy 對其運算。

附錄 B, 後向傳播算法，解釋大多數神經網絡學習程序的數學原理細節。

附錄 C, 與深入學習下圍棋相關的圍棋程序和服務器。

附錄 D, 使用 Amazon 云服務器訓練、部署你的機器人。

附錄 E, 將你的機器人提交 Online Go Server (OGS), 與世界各地的棋手對弈，測試你的機器人。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
『深度學習與圍棋遊戲』筆記 1

最近,搞到一本書 Deep Learning and the Game of Go 。歐美書商好像有種習慣，科技方面尤其編程相關的電子書，銷售一段時間後會公開放到網上，供人免費下載。這本書就來源於此。估計，有社會資本支持書商的善舉。希望國內資本雄厚的企業，向西方學習，鼓勵支持國內書商也這樣做。這本書分為3篇14章及5個附錄。第一篇：基礎第1章, 簡明扼要地介紹人工智能、機器學習、深度學習...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。