五子棋AI算法第七篇-Zobrist

关于本博客

这个博客不是把五子棋算法研究透彻之后再写的,而是一边研究算法一边写代码,同时一边写博客,所以有些博文的顺序不太对,比如 Zobrist 其实应该放在算杀之前就讲的。不过这并没有大的影响,总体上的顺序是OK的。

另外,这一系列博客讲的五子棋代码其实是一个开源的项目,源码地址: https://github.com/lihongxun945/gobang

由于是边写代码边写博客,所以博客中的代码不是最新的,甚至是有bug的,所以源码请尽量参考上述开源项目中的代码。比如之前讲极大极小值搜索改为负极大值的时候,对玩家的评分就出现了一个重要bug,在后序的提交中修正了这个bug。

Zobrist

Zobrist 是一个快速Hash算法,非常适合用在各种棋类游戏中(事实上也是在各种棋类游戏中有大量应用)。

我们前面讲了负极大值搜索和算杀,其实很多时候会有重复的搜索,比如这种:

[7,7],[8,7],[7,6],[7,9]

其实它和下面这种的走法只是顺序不同 ,最终走出来的局面是一样的:

[7,6],[7,9],[7,7],[8,7]

那么如果我们搜索中碰到了上面两种情况,我们会对两种情况都进行一次打分,而其实有了第一次的打分,完全可以缓存起来,第二次就不用打分直接使用缓存数据了。除了这种情况,其实以前的搜索结果也可以存下来,可以用在启发式搜索中。

那么现在的问题就是,我们应该怎么表示一种局面呢?显然需要通过一种哈希算法,而且这个算法不能太慢,不然可能反而会降低搜索速度。而 Zobrist 就是一种满足我们需求的快速数组哈希算法。关于Zobrist算法请参考 https://en.wikipedia.org/wiki/Ben_Zobrist

Zobrist 效率非常高,每下一步棋,只需要进行一次 异或 操作,相对于对每一步棋的打分来说,这一次异或操作带来的性能消耗可以忽略不计。Zobrist具体实现如下:

  • 初始化一个两个 Zobrist[M][M] 的二维数组,其中M是五子棋的棋盘宽度。当然也可以是 Zobrist[M*M] 的一维数组。设置两个是为了一个表示黑棋,一个表示白旗。
  • 上述数组的每一个都填上一个随机数,至少保证是32位的长度(即32bit),最好是64位。初始键值也设置一个随机数。
  • 每下一步棋,则用当前键值异或Zobrist数组里对应位置的随机数,得到的结果即为新的键值。如果是删除棋子(悔棋),则再异或一次即可。

对应的JS代码如下:

var Zobrist = function(size) {
  this.size = size || 15;
}

Zobrist.prototype.init = function() {
  this.com = [];
  this.hum = [];
  for(var i=0;i<this.size*this.size;i++) {
    this.com.push(this._rand());
    this.hum.push(this._rand());
  }

  this.code = this._rand();
}

Zobrist.prototype._rand = function() {
  return Math.floor(Math.random() * 1000000000);  //再多一位就溢出了。。
}

Zobrist.prototype.go = function(x, y, role) {
  var index = this.size * x + y;
  this.code ^= (role == R.com ? this.com[index] : this.hum[index]);
  return this.code;
}

源码在 zobrist.js 文件里。

注意每次走棋都要进行一次zobrist操作。千万不要自行设计哈希函数,除非你能保证你的哈希函数比一次64位整数的异或操作更简单,并且同时证明冲突的概率很低。Zobrist数组中的随机数的 质量 很重要,不过我用JS内置的 Math.random() 生成的随机数暂时没有发现问题,如果这个随机度不够高,可以考虑换用一些更好的随机函数。

有了这个快速hash算法,我们就可以通过一个64位的整数来表示一个棋局。至于该存哪些信息,该怎么使用,下一篇再讲。

  • 8
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
围棋是一种复杂的博弈,对于围棋人机对弈,通常采用博弈树搜索算法。而为了加快搜索速度,可以使用Zobrist Hashing技术来优化搜索。 具体实现步骤如下: 1. 定义棋盘状态 我们需要定义一个二维数组来表示棋盘。其中,空点用0表示,黑子用1表示,白子用2表示。 2. 定义Zobrist哈希表 我们需要定义一个Zobrist哈希表,用来存储每个棋盘状态的哈希值。在实现中,我们需要定义一个随机数数组,用来表示每个点的随机哈希值,然后通过异或运算将每个点的哈希值合并成整个棋盘状态的哈希值。 3. 实现博弈树搜索算法 我们需要实现一个博弈树搜索算法,来搜索最优的下棋位置。在实现中,我们可以采用极小极大算法来搜索最优解。具体实现步骤如下: - 对于当前棋盘状态,首先计算出当前哈希值,并查询Zobrist哈希表,如果已经存在该状态的哈希值,则直接返回对应的估值。 - 如果当前状态不在哈希表中,则遍历所有空点,逐个尝试落子,并递归搜索下一层棋盘状态。 - 在递归搜索下一层时,交换当前玩家,并更新哈希值。 - 在搜索完所有子状态后,根据当前玩家的颜色,返回最大或最小的估值,并将当前状态的哈希值和估值存入Zobrist哈希表中。 4. 实现下棋功能 当我们搜索出最优的下棋位置后,就可以将对应的棋子落在棋盘上,并更新棋盘状态和哈希值。 总结: 通过以上步骤,我们可以实现一个基于Zobrist哈希表和博弈树搜索算法的围棋人机对弈程序。该程序可以在较短时间内搜索出最优解,并且可以通过调整博弈树的深度来控制搜索速度和难度。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值