Alpha Zero
文章平均质量分 71
lawme
这个作者很懒,什么都没留下…
展开
-
Alpha Zero 趣味学习:TicTacToe
Alpha Zero 趣味学习:TicTacToe 深度学习风行天下的起始,是围棋软件 AlphaGo 的成功。 从游戏软件开发中学习 deep learning,可以适当避开深度学习理论的繁难晦涩、枯燥乏味,值得一试。 AlphaGo 有着名垂青史的赫赫功绩,但也有其难免的弱点。它的学习方法属于有监督学习,需要海量标注数据,不仅使得开发成本居高,并且学习者难有充足数据可用。 AlphaG...原创 2018-09-05 00:45:32 · 598 阅读 · 0 评论 -
Alpha Zero 趣味学习:设置网络参数
Alpha Zero 趣味学习:设置网络参数原创 2018-09-06 08:49:35 · 1020 阅读 · 0 评论 -
Alpha Zero 趣味学习:训练网络
启动 TicTacToe ,会进入网络训练或人机对弈。如果不设置启动参数 –human_play=1,便自动进入网络训练。即: python main.py 开始训练前,要在 main.py 中做两件事情。第一,初始化游戏和网络: if CFG.game == 0: game = TicTacToeGame() net = NeuralNetworkWrapper(game) ...原创 2018-09-07 16:19:10 · 766 阅读 · 0 评论 -
『深度學習與圍棋遊戲』筆記 1
最近,搞到一本書 Deep Learning and the Game of Go 。 歐美書商好像有種習慣,科技方面尤其編程相關的電子書,銷售一段時間後會公開放到網上,供人免費下載。這本書就來源於此。 估計,有社會資本支持書商的善舉。希望國內資本雄厚的企業,向西方學習,鼓勵支持國內書商也這樣做。 這本書分為3篇14章及5個附錄。 第一篇:基礎 第1章, 簡明扼要地介紹人工智能、機器學習、深度學習...翻译 2019-04-11 06:22:56 · 583 阅读 · 0 评论 -
『深度學習與圍棋遊戲』筆記 2
教機器學習的內容 佈局模型庫。由高手佈局棋譜中的高頻率走步構成。 建立棋局狀態搜索樹。 盡量減少備先的下一步棋。 估算每步棋的價值。 衡量機器人的棋力 傳統的日本級段制。 與機器人或者人類比賽測定。 建造第一個機器人 ...翻译 2019-04-16 10:34:33 · 460 阅读 · 0 评论