基于人工神经网络的五子棋博弈(Details)

最新推荐文章于 2024-08-05 11:15:19 发布

rm_wang

最新推荐文章于 2024-08-05 11:15:19 发布

阅读量1.5w

点赞数 12

分类专栏：人工智能

本文链接：https://blog.csdn.net/rm_wang/article/details/52012646

版权

感兴趣的朋友可以在git上查看该项目: https://github.com/jimth001/my-Gobang-game-base-AI-algorithm.git

研究报告

作品名称基于神经网络的五子棋博弈系统

类别科技发明制作B 类

2016 年 3 月

1. 摘要

计算机博弈一直是人们很关注的研究方向。从以前的“深蓝”到如今的AlphaGo，计算机博弈取得了很多成就，有了很大进展。AlphaGo与李世乭的围棋之战引得了很多人对深度学习，对人工智能的关注。我对计算机博弈也很感兴趣，尤其是五子棋。现在网络上很多的五子棋游戏都是基于规则的，最大的漏洞就在于你如果赢了它一盘，按照同样的套路下即可赢它。基于上面几点，我想到了可以设计一个有学习性的五子棋博弈算法，改善这种情况，提高五子棋人机博弈的趣味性和多变性；同时我也希望该算法经过一定规模的训练能够达到较高的博弈水平。因此，我利用人工智能的相关知识和计算机博弈的知识设计了基于神经网络的五子棋博弈算法，并开发了可演示算法的演示系统以及算法的接口dll。

本作品的核心和难点在于神经网络的结构（包括网络拓扑结构，输入结构，输出结构）及学习算法。在经过查阅资料和大量实践之后，我确定了三层感知器的拓扑结构和96个实型特征向量的输入结构以及网络以单实型值输出。

算法以博弈树搜索及剪枝为整体架构，结合对棋局的特征提取及神经网络预测局势来完成AI的决策。。试验表明，它对于同一套路的棋局学习速度较快，可以在几盘对弈后有明显的表现提升。

在后面的实验中，AI初始表现不佳，对于如何进攻防守的学习较慢，为了增强它的初始“智能”，我对必胜局加入了规则判定以提升AI的初始表现。并利用低层搜索优化了高层搜索的剪枝效率。

现在，我已经设计了用于演示的JAVA程序，并提供了可用于训练的dll接口。演示程序可以通过人机对弈演示它的学习特性，若使用一个未经训练过的网络权值，在重复套路对弈的情况下，它的学习效果通常通过数盘即可显示出来。在经过大规模的训练后，该算法将有更加广泛的应用前景。

关键词：五子棋博弈；人工神经网络；强化学习；博弈树搜索；α-β剪枝