基于人工神经网络的五子棋博弈的一些思路

最新推荐文章于 2023-08-28 22:30:11 发布

rm_wang

最新推荐文章于 2023-08-28 22:30:11 发布

阅读量6.3k

点赞数 1

分类专栏：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rm_wang/article/details/50813502

版权

初学人工智能导论的时候写了一个基于神经网络的五子棋博弈小程序，此为作品文档，欢迎大神的指点。

摘要由CSDN通过智能技术生成

初学人工智能导论的时候写了一个五子棋博弈的小程序，今天整理下思路写在这里，欢迎大神的指点。

五子棋博弈程序有很多，传统的基于规则的方法大都是对不同的棋型赋予不同的权值，用固定的函数评价当前的棋局，并结合博弈树的α-β剪枝来实现。这种实现方法的效果很依赖于权值的确定，对设计者的经验要求较高。如果我们采用一个动态的估值函数来评价棋局，让它能在对弈过程中不断成长，或许会有更好的效果。出于这种想法，我们可以选择采用神经网络来做评价函数。

接下来的问题就是我们要采用什么样的网络，网络的拓扑结构如何，采用什么样的学习方式？我最终选择了有一个隐含层的多层感知器的结构，先对棋局进行特征提取，然后将特征作为网络输入，输出一个数值作为对当前局势的估值。确定了网络结构，接下来就是确定如何学习的问题，TD强化学习算法使我受到了启发。我们显然不能用BP网络的的学习方式，因为我们不能准确给定每个局面的正确估值（如果我们有能力做到这一点，也就不用使用神经网络了），但是我们能够确定最后一个局面的估值应该是多少。如果最后自己输了，则估值为-1，赢了估值为1。和棋的时候不进行学习。（选用正负1作为标准输出是因为采用了线性激活函数，不能使用正负无穷）我们也不能只对最后一个局面进行学习，我们希望能够对每个局面都进行学习，那么我们能不能根据这个最后的局面给出前面若干个局面的合理估值呢？我们做这样的假设：在开始的时候，双方优势相当，评估值应为0，然后随着对弈，优势逐渐改变

最低0.47元/天解锁文章

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
2
评论
基于人工神经网络的五子棋博弈的一些思路

初学人工智能导论的时候写了一个基于神经网络的五子棋博弈小程序，此为作品文档，欢迎大神的指点。
复制链接

扫一扫

专栏目录

rm_wang CSDN认证博客专家 CSDN认证企业博客

码龄8年

5: 原创

131万+: 周排名

89万+: 总排名

3万+: 访问

: 等级

349: 积分

14: 粉丝

19: 获赞

5: 评论

89: 收藏

私信

关注

热门文章

分类专栏

最新评论

基于人工神经网络的五子棋博弈(Details)
A16486994: 倒推值的意思是这样吗？以当前对手走完的状态为计算的初始状态，我要计算我当前最佳的应对方案还要考虑一下我选取完这个方案后对手给出的最佳方案得分是多少。如果高了则不选取我之前确定的方案。如果我找到了对手最低得分的反应则我选取的应对方案即为倒退值。
基于一阶HMM的中文词性标注（Java实现）
qq_43923594: 请问训练语料在哪里找？
基于人工神经网络的五子棋博弈(Details)
chonglouxuanxiao: 你好，请问test2这个函数的作用是什么？
基于人工神经网络的五子棋博弈的一些思路
rm_wang 回复 lishuandao: 你好，后来我写过一篇“基于人工神经网络的五子棋博弈(Details)”，详细介绍了实现方法。同样在“人工智能”分栏下，有兴趣的话你可以看看。
基于人工神经网络的五子棋博弈的一些思路
lishuandao: 你好，可以大概讲一下你的神经网络的结构吗？我也想尝试用TD方法做一下这个AI。

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。