围棋AI之路（三）UCT，进来之后才发现是地狱

最新推荐文章于 2022-07-30 10:56:09 发布

oyd

最新推荐文章于 2022-07-30 10:56:09 发布

阅读量1.2w

点赞数 2

分类专栏：算法文章标签：算法测试存储

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oyd/article/details/3618131

版权

本文详细介绍了围棋AI中使用的UCT算法，读者将深入理解这一决策策略，并通过提供的代码进行实践。

摘要由CSDN通过智能技术生成

照例还是先公布代码 http://download.csdn.net/source/913373

以及编译好的可执行程序，下载地址：http://download.csdn.net/source/913515

前面介绍的UCT算法听起来很诱人，但是只有你真正去实验一下你才知道原来有这么多问题。

理论上，UCT是一个一致的算法，它可以随着模拟次数的增加而自然提高棋力，而且理论上，它还可以计算到任意深度，而且理论上，它是天然支持并行计算的。

但是，看看它华丽的外衣下面隐藏着哪些东西吧：

一、模拟速度和内存问题

目前的模拟速度是让我满意的，但是内存跟不上，9路棋盘上的5万局模拟+UCT选择，也只需要1秒多时间，10万局也就差不多3秒钟，但是，如果我想持续进行120秒的模拟，1G的内存也是不够用的。

给我的感觉这个算法需要的内存比并行运算更重要，两个CPU分别模拟5万次和1个CPU独自模拟10万次，结果是不同的。如果我有64位的内存，我觉得这个算法的前景会很可观。

随后我自己想了一种方法来在有限的内存中模拟较长的时间，就是发现内存将要用完时，把胜率不佳的子树砍掉。但是这个改动破坏了算法的一致性，我用围棋试验的结果就是，AI超喜欢把棋连成一根长棍，而且走棋过程中自我感觉良好，快终局

最低0.47元/天解锁文章

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

oyd CSDN认证博客专家 CSDN认证企业博客

码龄22年

81: 原创

17万+: 周排名

74万+: 总排名

95万+: 访问

: 等级

8209: 积分

186: 粉丝

20: 获赞

236: 评论

64: 收藏

私信

关注

热门文章

分类专栏

UNIX 23篇
VC/MFC 3篇
Windows相关 3篇
医学 12篇
杂谈 24篇
武学 8篇
灌水机技术 4篇
算法 16篇
编程低手箴言 4篇
财经/股市 2篇
吐槽 1篇

最新评论

围棋AI之路（二）棋盘的实现
「已注销」: 现在来看很感慨啊，本来100年以后才能实现的东西，8年后就被实现了。。。技术的进步真的是非线性的，所以AGI什么时候能实现呢？哈哈
发现一个超立方体的模型，感慨人类脑子不够用呀
4166NT4.32: 链接呢？怎么没了？
发现一个超立方体的模型，感慨人类脑子不够用呀
qq_45921555: 初来乍到
EMACS 对 vi：永无止境的圣战
「已注销」: vim就是unix记事本，emacs是Scheme语言内嵌编辑器，这是起源。vim代表用适合的方式解决问题，emacs代表用一种方式解决所有问题，这是信仰。"其它编辑器"，代表你不关心编程本身，而只关心解决问题，正真程序员往往只关心编程本身而不关心问题。想当年，Borland C++ Builder Compiler，整个编译器用汇编写成，导致一人离开，Borland倒闭。这就是编程本身问题。用信仰构建世界，这就是vim emacs所讲的！！！

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。