棋类博弈搜索算法

最近在写一个棋类博弈算法,总结一下用到的搜索算法博弈树 一般的搜索是单一对象的,就像一个人在房间里寻找任务物品,只要找到了就赢了。 而棋类博弈用到的是对抗性博弈,有两方,两人在房间里寻找任务物品,谁先找到谁赢。 跟普通的搜索树不同,博弈树的每一层代表一方的走法,他们是交替的,代表甲方走法的子节点是乙方的走法。 ...
摘要由CSDN通过智能技术生成

最近在写一个棋类博弈算法,总结一下用到的搜索算法

博弈树

           一般的搜索是单一对象的,就像一个人在房间里寻找任务物品,只要找到了就赢了。

           而棋类博弈用到的是对抗性博弈,有两方,两人在房间里寻找任务物品,谁先找到谁赢。

           跟普通的搜索树不同,博弈树的每一层代表一方的走法,他们是交替的,代表甲方走法的子节点是乙方的走法。

           博弈树是从根部向下递归产生的一颗包含所有可能的对弈过程的完全搜索树。

           令甲胜的局面值为WIN,乙胜的局面值为LOST,平局为DRAW。轮到甲走时,甲肯定会选择节点值为WIN或者DRAW的,

轮到乙走时,乙肯定会选择节点值为LOST或者DRAW的。

           

极大极小算法

          建立整颗搜索树,因为棋局涉及到的状态转换数量及其大,这是不可能的。

          所以我们考虑用具体的值来表示局面值WIN,LOST,DRAW,例如甲胜为+∞,乙胜为-∞,和局为0。

          甲希望得到极大值,乙希望得到极小值。

int MinMax(position p, int depth)
{
	int bestvalue, value;
	if (Game Over)
		return evaluation(p);
	if (depth <= 0)
		return evaluation(p);
	if (p.color == RED)
		bestvalue = -INFINITY;
	else
		bestvalue 
  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
确实很有挑战性!MineMax算法是一种博弈搜索算法,用于两个玩家的零和游戏,例如棋类游戏中的黑白棋、国际象棋、围棋等等。你可以使用Python编写一个函数,该函数接受一个游戏状态和一个数字,返回可用操作的最大值和最小值之间的区别。 MineMax算法是在minimax算法的基础上进行扩展的,主要思想是在搜索过程中,不仅仅考虑到对手的最小化行为,同时也考虑对自己最大化行为的可能。 下面是一个简单的实现来帮助你入门: ``` python def mine_max(state, depth): if depth == 0 or state.is_terminal(): return state.get_score() if state.get_turn() == MAX_PLAYER: max_value = -float('inf') for action in state.get_actions(): new_state = state.apply(action) value = mine_max(new_state, depth - 1) max_value = max(max_value, value) return max_value else: #turn == MIN_PLAYER min_value = float('inf') for action in state.get_actions(): new_state = state.apply(action) value = mine_max(new_state, depth - 1) min_value = min(min_value, value) return min_value ``` 这个函数通过递归调用minmax算法,在深度为depth的情况下返回最佳行动序列,其中MAX_PLAYER和MIN_PLAYER是玩家的标识符。需要提醒一下的是,在使用该算法进行博弈搜索时,搜索深度是一个至关重要的参数,如果你搜索的深度太浅,算法很可能会无法找到最好行动序列。但是,如果深度太深,算法搜索复杂度将会成指数级增长,此时,算法会变得非常耗费计算资源。因此,在实践中,我们需要根据具体情况权衡搜索深度的合理性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值