机器博弈中的数据结构与基本方法(一)-----总结

一、基本概念

  博弈分类:单人博弈(华容道)、双人博弈(象棋、围棋)、多人博弈(麻将、桥牌);完全信息博弈(象棋、围棋)、不完全信息博弈(麻将、桥牌、三国杀等)。

  注:大一曾选修过一门课:博弈论,也在数模班做过一些博弈方面的研究,有一些基础,所以对机器博弈中博弈概念很容易就理解了。但博弈论(Game Theory)是经济学的一个重要分支(虽然我发现我们学校图书馆有关博弈论的书籍主要放在数学类书架,这也是有其原因的),主要研究的是社会两难问题(如经典的囚徒困境问题),通常是非零和博弈(即致力于出现双赢局面),而机器博弈(以棋类为代表)主要研究零和博弈(即博弈参与者一方获利另一方必然遭受损失,比如所有的棋类都以战胜对方为目的)。关于经济学中的博弈在此不做赘述。

二、机器博弈中的数据结构

  关于数据结构的具体知识在此不做赘述,如果没有此方面知识根本没必要往下看。本学期刚刚学完数据结构,有些同学觉得都是很枯燥的理论,其实这枯燥与有趣之间缺德就是那么一点探索精神和自主学习意识,如果AI五子棋------------初探用的就是很基本的数组。以象棋为例,可以用数组存储棋盘,用布尔矩阵检查合法性。

  排序、查找在机器博弈中也频繁使用,因为要对每一种策略的得分(这个概念下面解释)进行筛选,找出最优策略。

  递归及回溯思想同样很重要。

  在涉及图的存储是,邻接表是实际应用最广泛的。

三、着法

  着法就是一个棋子从一个位置移动到另一个位置(象棋)或将不在棋盘上的棋子放在棋盘上某个位置(五子棋、围棋)。机器博弈要直接解决的问题就是如何做出最优着法。着法的最基本的要求是符合游戏规则,比如马走日,象飞田,马脚蹩子不能走,象眼堵住不能走等等。

四、博弈树

  今年李世石和AlphaGo的人机大战让蒙特卡洛树搜索从一个高深的专业词汇变成了一个众口相传的科技热词。博弈树分支越多,该类博弈对于程序设计的要求就越高,因为是指数增长的,所以除非NP=P,否则博弈树存储及搜索永远是一个难题,也是左右机器博弈水平的关键因素。

五、评估函数

  评估函数就是一个打分机制,通过评估函数,上文中贴出的连接中所使用的赢法数组就是一种简单的评估函数,评估函数是着法的基础,评估函数的合理性很大程度影响博弈水平。我猜想,机器学习很重要的一部分就是通过重复博弈来反复调整评估函数达到最佳状态。此外,专业棋手肯定比程序编写者更适合设计评估函数,因为他们的经验正是机器学习的目的。此外,已经启发式算法(模拟退火算法、遗传算法)也被广泛应用到机器博弈中,我曾经用模拟退火算法写过最短路径的程序021 模拟退火算法学习(一)-----求解最短连通路径,确实这种启发式算法能有效避免全局搜索的低效和爬山算法(一种贪心策略)局部最优解问题。

六、基本搜索方法

  产生博弈树之后海妖搜索博弈树获得一个最优解,常用的搜索策略有DFS和BFS,但是DFS搜索整个博弈树显然是不现实的,所以都会认为设置深度,但是过浅则影响博弈水平,过深则影响时间效率。同样,启发式搜索也是一种不错的选择,如极大极小法,alpha-beta剪枝,负极大值搜索。

七、博弈程序设计

  语言选择,面向对象语言在设计大型程序时优势明显。界面应该美观易用,交互性好。逻辑结构应该清晰,功能应该完备,包括基本设置,搜索策略设置,悔棋、打谱、存盘等基本功能。

  

转载于:https://www.cnblogs.com/zhaoyu1995/p/5640428.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
问题描述:将马随机放在国际象棋的 8X8 棋盘的某个方格,马按走棋规则进行移动。要求每个方格上只进入一次,走遍棋盘上全部 64 个方格。编制递归程序,求出马的行走路线 ,并按求出的行走路线,将数字 1,2,…,64 依次填入 8X8 的方阵输出之。测试数据:由读者指定可自行指定一个马的初始位置。实现提示:每次在多个可走位置选择一个进行试探,其余未曾试探过的可走位置必须用适当结构妥善管理,以备试探失败时的“回溯”悔棋使用。并探讨每次选择位置的“最佳策略”,以减少回溯的次数。 背景介绍: 国际象棋为许多令人着迷的娱乐提供了固定的框架,而这些框架常独立于游戏本身。其的许多框架都基于骑士奇异的L型移动规则。一个经典的例子是骑士漫游问题。从十八世纪初开始,这个问题就引起了数学家和解密爱好者的注意。简单地说,这个问题要求从棋盘上任一个方格开始按规则移动骑士,使之成功的游历国际象棋棋盘的64个方格,且每个方格都接触且仅接触一次。 可以用一种简便的方法表示问题的一个解,即将数字1,……,64按骑士到达的顺序依次放入棋盘的方格。 一种非常巧妙的解决骑士漫游地方法由J.C.Warnsdorff于1823年给出。他给出的规则是:骑士总是移向那些具有最少出口数且尚未到达的方格之一。其出口数是指通向尚未到达方格的出口数量。在进一步的阅读之前,你可以尝试利用Warnsdorff规则手工构造出该问题的一个解。 实习任务: 编写一个程序来获得马踏棋盘即骑士漫游问题的一个解。 您的程序需要达到下面的要求: 棋盘的规模是8*8; 对于任意给定的初始化位置进行试验,得到漫游问题的解; 对每次实验,按照棋盘矩阵的方式,打印每个格被行径的顺序编号。 技术提示: 解决这类问题的关键是考虑数据在计算机的存储表示。可能最自然的表示方法就是把棋盘存储在一个8*8的二维数组board。以(x,y)为起点时骑士可能进行的八种移动。一般来说,位于(x,y)的骑士可能移动到以下方格之一:(x-2,y+1)、(x-1,y+2)、(x+1,y+2)、(x+2,y+1)、(x+2,y-1)、(x+1,y-2)、(x-1,y-2)、(x-2,y-1)。但请注意,如果(x,y)的位置离某一条边较近,有些可能的移动就会把骑士移到棋盘之外,而这当然是不允许的。骑士的八种可能的移动可以用一个数组MoveOffset方便地表示出来: MoveOffset[0]=(-2,1) MoveOffset[1]=(-1,2) MoveOffset[2]=(1,2) MoveOffset[3]=(2,1) MoveOffset[4]=(2,-1) MoveOffset[5]=(1,-2) MoveOffset[6]=(-1,-2) MoveOffset[7]=(-2,-1) 于是,位于(x,y)的骑士可以移动到(x+MoveOffset[k].x, y+MoveOffset[k].y),其k是0到7之间的某个整数值,并且新方格必须仍位于棋盘上。
问题描述:将马随机放在国际象棋的 8X8 棋盘的某个方格,马按走棋规则进行移动。要求每个方格上只进入一次,走遍棋盘上全部 64 个方格。编制递归程序,求出马的行走路线 ,并按求出的行走路线,将数字 1,2,…,64 依次填入 8X8 的方阵输出之。测试数据:由读者指定可自行指定一个马的初始位置。实现提示:每次在多个可走位置选择一个进行试探,其余未曾试探过的可走位置必须用适当结构妥善管理,以备试探失败时的“回溯”悔棋使用。并探讨每次选择位置的“最佳策略”,以减少回溯的次数。 背景介绍: 国际象棋为许多令人着迷的娱乐提供了固定的框架,而这些框架常独立于游戏本身。其的许多框架都基于骑士奇异的L型移动规则。一个经典的例子是骑士漫游问题。从十八世纪初开始,这个问题就引起了数学家和解密爱好者的注意。简单地说,这个问题要求从棋盘上任一个方格开始按规则移动骑士,使之成功的游历国际象棋棋盘的64个方格,且每个方格都接触且仅接触一次。 可以用一种简便的方法表示问题的一个解,即将数字1,……,64按骑士到达的顺序依次放入棋盘的方格。 一种非常巧妙的解决骑士漫游地方法由J.C.Warnsdorff于1823年给出。他给出的规则是:骑士总是移向那些具有最少出口数且尚未到达的方格之一。其出口数是指通向尚未到达方格的出口数量。在进一步的阅读之前,你可以尝试利用Warnsdorff规则手工构造出该问题的一个解。 实习任务: 编写一个程序来获得马踏棋盘即骑士漫游问题的一个解。 您的程序需要达到下面的要求: 棋盘的规模是8*8; 对于任意给定的初始化位置进行试验,得到漫游问题的解; 对每次实验,按照棋盘矩阵的方式,打印每个格被行径的顺序编号。 技术提示: 解决这类问题的关键是考虑数据在计算机的存储表示。可能最自然的表示方法就是把棋盘存储在一个8*8的二维数组board。以(x,y)为起点时骑士可能进行的八种移动。一般来说,位于(x,y)的骑士可能移动到以下方格之一:(x-2,y+1)、(x-1,y+2)、(x+1,y+2)、(x+2,y+1)、(x+2,y-1)、(x+1,y-2)、(x-1,y-2)、(x-2,y-1)。但请注意,如果(x,y)的位置离某一条边较近,有些可能的移动就会把骑士移到棋盘之外,而这当然是不允许的。骑士的八种可能的移动可以用一个数组MoveOffset方便地表示出来: MoveOffset[0]=(-2,1) MoveOffset[1]=(-1,2) MoveOffset[2]=(1,2) MoveOffset[3]=(2,1) MoveOffset[4]=(2,-1) MoveOffset[5]=(1,-2) MoveOffset[6]=(-1,-2) MoveOffset[7]=(-2,-1) 于是,位于(x,y)的骑士可以移动到(x+MoveOffset[k].x, y+MoveOffset[k].y),其k是0到7之间的某个整数值,并且新方格必须仍位于棋盘上。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值