博弈搜索的主要思想_AI研习丨专题:随机性博弈估值函数及其搜索策略研究

摘 要

随机性特性增加了爱恩斯坦棋估值难度,而且,爱恩斯坦棋博弈程序在进攻与防守之间的协调也是关键问题之一。为此,针对距离和概率两个重要估值因素,设计了随机特性的估值函数;基于MonteCarlo算法与期望搜索算法,引入多线程技术,提出了一种混合优化算法;从进攻和防御两个方向出发,重构爱恩斯坦棋博弈系统。实验结果表明,改进的博弈体系极大提升了计算机博弈棋力。

关 键 字

估值函数;混合优化算法;爱恩斯坦棋博弈

0 引言

近年来,计算机博弈的发展,一方面为人工智能的进步提供了重要的理论与方法,在中国象棋、围棋等完备信息博弈方面的研究已经取得了瞩目的成果;另一方面对于军棋、二打一扑克等非完备信息博弈,因具有模糊性和随机性的不确定性博弈,虽然在算法应用研究方面有一定进展, 但相关理论研究还不成熟,其博弈技术还需持续探索。

本文以爱恩斯坦棋为研究载体。虽然爱恩斯坦棋盘较小,而且投骰子的趣味性可能被误认为 是相对简单的棋类游戏,可实际对弈就会明白, 规则虽简单却也隐藏着巨大的计算与灵活的策略, 属于随机性强的不确定性博弈,其局面评估更是难以量化研究。现有研究虽已提出了距离和概率两个估值因素,但只是简单的估值,包含知识量相对较少,对于棋盘状态估值不准确,结合搜索策略,博弈程序仍体现出行棋不稳定、棋力低下的现象。

本文针对爱恩斯坦棋的随机特性,以及占领对角的赢棋方式,设计了削减随机性的效率较好且准确的攻防兼备的估值函数;同时改进了

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值