动手实现并行版AlphaZero五子棋

最新推荐文章于 2022-10-29 11:03:49 发布

weixin_33736832

最新推荐文章于 2022-10-29 11:03:49 发布

阅读量959

点赞数

文章标签： c/c++ python 人工智能

原文链接：https://juejin.im/post/5c9183daf265da611c5569e1

版权

前言

项目链接：github.com/hijkzzz/alp…

AlphaZero算法已经发布了一年多了，GitHub也有各种各样的实现，有一千行Python代码单线程低性能版，也有数万行C++代码的分布式版本。但是这些实现都不能满足一般的算法爱好者的需求，即一个简单的并且单机的可运行的高性能AlphaZero算法。

一图解密AlphaZero

首先我们通过一张图了解一下AlphaZero算法的原理

可以看到AlaphaGo Zero的算法流程分为：

自对弈（利用蒙特卡洛树搜索）N局生成棋谱
利用生成的棋谱训练网络
评估新训练的网络

分析

对于Python版本的AlphaZero算法，通常受限制于GIL，过程中最耗时间的自对弈阶段（见下图）无法并行化，所以最直接的优化方式是使用C++这种高性能语言实现底层运算细节。

解决方法

最低0.47元/天解锁文章

weixin_33736832

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
动手实现并行版AlphaZero五子棋

前言项目链接：github.com/hijkzzz/alp…AlphaZero算法已经发布了一年多了，GitHub也有各种各样的实现，有一千行Python代码单线程低性能版，也有数万行C++代码的分布式版本。但是这些实现都不能满足一般的算法爱好者的需求，即一个简单的并且单机的可运行的高性能AlphaZero算法。一图解密AlphaZero首先我们通过一张图了解一下AlphaZero算法...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。