AlphaGo Zero 初探

最新推荐文章于 2023-08-28 13:45:00 发布

机器学习X计划

最新推荐文章于 2023-08-28 13:45:00 发布

阅读量633

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/G88JmvEHMsJ1kd4v0c/article/details/78442179

版权

Deepmind 最近发布了 AlphaGo 的最新版本 AlphaGo Zero 的论文，AlphaGo 不再需要学习人类的经验，而是可以自己学习如何下围棋，而且最新的 Zero 可以打败之前的版本。

首先，围棋这个游戏是很难用暴力方法来搜索最优路径的，拿只有 9 格的 tic tac toe 游戏来说就有 3^9 ～ 19 000 种可能，每个格子可以是 ❌ ⭕️ 空白三种可能。

最低0.47元/天解锁文章

机器学习X计划

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
AlphaGo Zero 初探

Deepmind 最近发布了 AlphaGo 的最新版本 AlphaGo Zero 的论文，AlphaGo 不再需要学习人类的经验，而是可以自己学习如何下围棋，而且最新的 Zero 可以打败之前的版本。首先，围棋这个游戏是很难用暴力方法来搜索最优路径的，拿只有 9 格的 tic tac toe 游戏来说就有 3^9 ～ 19 000 种可能，每个格子可以是 ❌ ⭕️ 空白三种可能。AI 如果用
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。