java五子棋程序博客园,算法-如何设计一个,永不输的五子棋算法

问题描述:人们通常喜爱的五子棋。某方将结果连成五子即获胜。

问题规模:15x15棋盘。

算法:博弈树,极大极小算法+Alpha-Beta剪枝

法棋。

数据结构描述如下。

棋盘类:

棋盘为一个M*N的矩阵Tbl[M][N](定义LEDGE为左边界,REDGE为右边界,TEDGE为上边界,BEDGE为下边界)。

每个棋盘矩阵有两个评估矩阵CpuPri[M][N][4]和UserPri[M][N][4],矩阵的第三维分别记录了该点([0]水平、[1]垂直、[2]左上—右下、[3]左下-右上)的棋子数。若该点上棋子为USER下的,则UserPri中有值,CpuPri中值为0,反之亦然。该点无子时,两个评估矩阵上该点评估值均为0.

CpuSum:CpuPri矩阵的所有元素之和。UserSum:UserPri矩阵的所有元素之和。

tag:tag=CpuSum/UserSum,CPU战术选择标记。当tag大于1时CPU进攻,小于1时CPU防守。

Depth:深度。标记该棋盘位于博弈图的层次。

Father:该棋盘的前驱。Child:该棋盘的孩子棋盘链。nextBro:兄弟节点。

Node:一个点类,标记该棋盘下子的点。

算法描述如下。

一、由于存在对抗性,CPU分为进攻和防守两种方式。Tag>1时进攻,tag<1时防守。Tag的实际含义是对敌我的一个评估,当我方比敌方有利时选择进攻,当敌方比我方有利时选择防守。

二、对任意一棋盘生成博弈图的算法。

算法2-1

当CPU接到一张已落子n个的棋盘时:

1、计算此棋盘的CpuSum值和UserSum值,并得出tag值决定进攻还是防守。此标志在本次生成整个博弈树时都不变,也就是决定了进攻或防守后,选择时都依据此标志。

2、以CPU身份在棋盘的每个未落子的点上分别下一步棋,生成M*N-n个已落子n+1个的棋盘,分别计算评估值,并生成博弈树第一层;

3、再以USER身份在每个棋盘(已落子n+1个)每个未落子的点上再下一步棋生成M*N-n-1个棋盘,分别计算评估值并加入博弈树第二层。

4、回到步骤2,依次类推,CPU的身份不断在CPU和USER之间变化,直到生成树的深度大于给定深度MAX_DEP时为止,停止建图。

5、此时,将叶子节点的CpuSum和UserSum计算出来。

6、若决定进攻,则极大极小过程如下:

1)若某步为CPU走(depth值为偶数),则应当选择CpuSum最大的一个棋盘,即CPU选择了对CPU最有利的一步。(极大过程)

2)若某步为USER走(depth值为奇数),则应当选择CpuSum最小的一个棋盘(即相当于此时用户防守),此时相当于USER选择了对CPU最不利的一步。(极小过程)

7、若决定防守,则极大极小过程如下:

1)若某步为CPU走(depth值为偶数),则应当选择UserSum最小的一个棋盘,即CPU选择了对USER最不利的一步。(极大过程)

2)若某步为USER走(depth值为奇数),则应当选择UserSum最大的一个棋盘(即相当于此时用户进攻),此时相当于USER选择了对USER最有利的一步。(极小过程)

8、按照6、7的选择算法,从下至上,得到第1层的(M*N-n)个棋盘的CpuSum值和UserSum值。注:向上传递时,同时传递CpuSum和UserSum值,不论如何挑选。但棋盘并不向上传递。

9、在第0层决定如何走下一步,方法同6(1)或7(1),取决于CPU是防守还是进攻。此时将最适合的棋局的棋盘(位于博弈树第1层)返回,即完成了原棋局下一步的选择过程。

10、删除该图,算法结束。

三、剪枝

一个已经落子n的棋盘按照上面的算法向前预测k步会产生((MN-n)!/(MN-n-k)!)个棋盘。

例如,最大生成深度为3时,若一个15x15的棋盘已经由用户走了1步,那么CPU在预测下一步时会产生224223222=11089344个棋盘。若每个棋盘大小为8k(1515+151522=2025个int),则空间大小为86635.5MB=86.6GB,同时会有极大的耗时,这是用户无法接受的。

由于向前预测时会进行大量计算,同时产生巨大的数据,所以必须进行剪枝。

首先使用书上给出的Alpha-Beta剪枝计算,取得了一定的效果,但仍有很大的空间消耗。为了追求更高的速度,经过自己分析,采用了一个变形的Alpha-Beta剪枝法。

剪枝算法如下:

算法3-1

在生成一个棋盘的子棋盘前,将该图的CpuSum值和UserSum值计算出来,用2-1-6和2-1-7类似的判别方法,(此处以CPU进攻为例),当其子棋盘CpuSum值小于该棋盘的CpuSum值时则舍弃不加入博弈树,否则加入博弈树。其他情况同理。

算法分析:该剪枝算法不能保证得到最优解(类贪心算法),但有更快的速度和更小的空间占用,而且也在短时间内有更大概率搜到Threat-Space。其弱点在于容易被对手用一定的战术蒙骗。实验证明,下棋时几乎感觉不到CPU计算的过程,用户输入后,CPU几乎立刻得出结果。

五、下棋

下棋时,只需把棋盘交给用户,让用户点一个棋子,再将该棋盘交给CPU处理,选择下一步后,再还给用户。当某方出现五子时,游戏结束,判定该方胜利。

引自 博客园:http://www.cnblogs.com/xiaoliango/archive/2011/11/15/2249864.html

以上是15*15 ,如果要永不输的话,嘿嘿,把棋盘干脆搞成无法达到5个子的就OK了!

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值