【AlphaGo】【论文阅读】

本文详细解读了DeepMind发表在Nature 2016年的AlphaGo论文,介绍了其采用的深度神经网络和树搜索方法。通过学习人类专家棋谱训练策略网络和快速走子网络,再结合强化学习自我对弈优化。此外,价值网络用于评估棋局胜率,Monte-Carlo Tree Search策略确保决策质量。
摘要由CSDN通过智能技术生成

前后花了十个小时阅读这篇论文。

写得不正确的地方还请指教。

论文题目: Mastering the Game of Go with Deep Neural Networks and Tree Search

发表在 Nature, 2016, 上

作者 : (deepmind)  


首先整理一下这篇文章的主要方法:


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值