Roma II人工只能开发笔记(1)

最新推荐文章于 2024-04-23 10:33:25 发布

airekans

最新推荐文章于 2024-04-23 10:33:25 发布

阅读量483

点赞数

分类专栏： Linux C++ AI 文章标签：游戏 generation 网络 google

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/airekans/article/details/5508733

版权

Linux 同时被 3 个专栏收录

68 篇文章 0 订阅

订阅专栏

40 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

由于在这个学期的人工智能的课程，将原来从罗凯那拿过来的一些游戏拿来作为Project。

游戏的相关介绍可以上google查Roma II，在BGG上面能找到详细的介绍。

首先是这个游戏集成了卡片，对战，运气等成分在里面。

在设计AI的环节，由于这个游戏在一个player的环节里面可以做多个动作，而且动作的顺序和个数都不确定，并且由于卡片的效果的不同，所以在构造游戏的本身就非常有难度，而对于AI programming来说，则增加了minimax的搜索难度。

在刚开始的时候，使用了DFS的全搜索，有点类似于AIMA上面的CSP上面的backtracking，在所搜的叶节点的时候进行状态的评价，如果这个值大于目前的最好值，则将最优解设置成这个节点对应的动作序列。而这个评价函数我是使用了神经网络来做，对于神经网络的训练我使用了GA，因为这样可以形成非监督的一种学习。

在进行了一定次数的比赛之后，发现就算是在单一回合里面所搜本回合的最优动作序列都已经变得不可能。到目前位置，一个状态的最大分支数是78，最大深度是11，基本上这个数量级的搜索已经不可能使用普通的DFS搜索完成。

在这种情况下，如果使用GA来进行学习的话，效率非常低。在我的机器上跑，基本上一个generation就要2个小时以上，这样的训练效率实在是太慢了，而且产生的新一代的神经网络也具有很大的随机性，基本没有什么只能可言。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Roma II人工只能开发笔记(1)

由于在这个学期的人工智能的课程，将原来从罗凯那拿过来的一些游戏拿来作为Project。游戏的相关介绍可以上google查Roma II，在BGG上面能找到详细的介绍。首先是这个游戏集成了卡片，对战，运气等成分在里面。在设计AI的环节，由于这个游戏在一个player的环节里面可以做多个动作，而且动作的顺序和个数都不确定，并且由于卡片的效果的不同，所以在构造游戏的本身就非常有难度，而对于A
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。