博客摘录「【python】蒙特卡洛树搜索（MCTS）简单实现」2023年10月24日

最新推荐文章于 2024-07-25 15:39:18 发布

羊小咩～

最新推荐文章于 2024-07-25 15:39:18 发布

阅读量47

点赞数

文章标签：笔记 1024程序员节

本文链接：https://blog.csdn.net/weixin_53937120/article/details/134012946

版权

asynchronous policy and value 异步策略和价值

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

羊小咩～

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
博客摘录「【python】蒙特卡洛树搜索（MCTS）简单实现」2023年10月24日

asynchronous policy and value 异步策略和价值。
复制链接

扫一扫

python毕设基于蒙特卡洛树搜索实现的黑白棋对弈+源代码+文档说明

01-09

python毕设基于蒙特卡洛树搜索实现的黑白棋对弈+源代码+文档说明 - 不懂运行，下载完可以私聊问，可远程教学该资源内项目源码是个人的毕设，代码都测试ok，都是运行成功后才上传资源，答辩评审平均分达到96分，放心...

蒙特卡洛树搜索（MCTS）在Python中实现井字游戏策略优化详细教程

m0_57781768的博客

09-19

916

井字游戏（Tic Tac Toe）是大家都很熟悉的一款策略游戏，两个玩家轮流在3x3的棋盘上放置自己的标记（通常是’X’和’O’），目标是在任意方向上（横、竖、斜）连续三个自己的标记。而蒙特卡洛树搜索（MCTS）则是一种广泛用于复杂策略游戏（例如围棋、象棋等）的算法。在本文中，我们将结合这两者，使用MCTS为井字游戏制定策略。游戏开始时，棋盘上的九个位置都是空的。两名玩家轮流进行动作，'X’通常先开始。一名玩家只能在空的位置上放置自己的标记。第一名能连续放置三个自己标记的玩家胜出。

参与评论您还未登录，请先登录后发表或查看评论

蒙特卡洛树搜索及实现三子棋游戏

年糕的博客

12-10

1325

蒙特卡洛树搜索及实现三子棋游戏预备知识双人有限零和顺序游戏 MCTS运行所在的框架/环境是一个游戏，它本身是一个非常抽象和宽泛的概念，因此这里我们只关注一种游戏类型：双人有限零和顺序游戏。这个名词一开始听起来会有些复杂，但是实际上非常简单，现在来让我们将它分解一下：游戏：意味着我们在一种需要交互的情境中，交互通常会涉及一个或多个角色有限：表明在任意时间点，角色之间存在的交互方式都是有限的...

基于蒙特卡洛树搜索MCTS的黑白棋游戏python源码.zip

05-07

本项目在Reversi游戏上实现了三种搜索算法：蒙特卡洛树搜索MCTS，Alpha-Beta剪枝搜索，贪心算法。工作量使用Pygame框架，实现人机对弈的棋盘GUI界面。 蒙特卡洛树搜索算法的实现 Alpha-Beta剪枝搜索算法的实现 ...

基于蒙特卡洛树(MCTS)的多维监控异常根因分析python实现源码+超详细注释.zip

12-29

基于蒙特卡洛树(MCTS)的多维监控异常根因分析python实现源码+超详细注释.zip基于蒙特卡洛树(MCTS)的多维监控异常根因分析python实现源码+超详细注释.zip基于蒙特卡洛树(MCTS)的多维监控异常根因分析python实现源码+...

基于蒙特卡洛树搜索MCTS的黑白棋游戏Java源码+使用说明(支持双人对战、人机对战).zip

12-28

基于蒙特卡洛树搜索MCTS的黑白棋游戏Java源码+使用说明(支持双人对战、人机对战).zip基于蒙特卡洛树搜索MCTS的黑白棋游戏Java源码+使用说明(支持双人对战、人机对战).zip基于蒙特卡洛树搜索MCTS的黑白棋游戏Java源码...

MongoDB学习笔记

weixin_55355282的博客

07-25

1078

文章记录了作者从对MongoDB数据库的初步了解到深入学习的全过程，包括对MongoDB的基本概念、CRUD操作以及高级特性的学习过程。同时，文章还介绍了使用mongoose这个DB对象建模工具来对MongoDB进行操作和管理的学习过程。文章总结了学习过程中遇到的问题和解决方案，对于初学者来说是一篇很好的参考资料。

dsp c6657 SYS/BIOS学习笔记

小pp的博客

07-25

246

SYS/BIOS是一种用于TI的DSP平台的嵌入式操作系统（RTOS）。

谷粒商城实战笔记-59-商品服务-API-品牌管理-使用逆向工程的前后端代码

epitomizelu的专栏

07-25

419

品牌管理的代码使用逆向工程生成的代码，再次基础上进行修改。小细节，使用逆向工程生成代码时，要注意分页导致只生成部分代码，可以调整每页显示的数据条数，一次把所有的数据都显示出来。把逆向工程中与品牌相关的两个代码文件是brand.vue和。拷贝到前端工程中。

谷粒商城实战笔记-62-商品服务-API-品牌管理-OSS整合测试

epitomizelu的专栏

07-25

1013

通过上述步骤，你可以在Java项目中轻松地整合阿里云OSS服务，实现文件的上传、下载等功能。阿里云OSS提供了丰富的API和工具，可以根据你的业务需求进一步定制和扩展。希望这篇博客能帮助你在Java项目中顺利整合阿里云OSS服务。如果有任何疑问或需要进一步的帮助，请随时提问！

谷粒商城实战笔记-63-商品服务-API-品牌管理-OSS获取服务端签名

epitomizelu的专栏

07-25

1090

因此，上传文件涉及到第三方服务阿里云OSS，以后还会有第三方短信服务等，为了统一管理第三方服务，创建一个专门的模块third-party。

《计算机网络》（学习笔记）

qiqi_liuliu的博客

07-24

2001

网络（Network）由若干结点(Node)和连接这些结点的链路(Link)组成多个网络还可以通过路由器互连起来，这样就构成了一个覆盖范围更大的网络，即互联网（互连网）。因此，互联网是"网络的网络（Network of Networks）"因特网（Internet）是世界上最大的互连网络（用TCP/IP）internet是通用名词，互连的网络都叫internet注：互连、自治、集合。在计算机内部或在相邻设备之间近距离传输时，可不经过调制就在信道上直接进行的传输方式称为基带传输。

谷粒商城实战笔记-61-商品服务-API-品牌管理-云存储开通与使用

epitomizelu的专栏

07-25

1003

文章目录一，图片云存储二，阿里云OSS1，OSS2，基于OSS的文件上传架构3，Java中使用OSS 一，图片云存储这张图展示了文件存储的几种常见模式：普通上传分布式情况下的普通上传使用自建服务器云存储服务的情况普通上传：在这种情况下，浏览器直接将文件上传给商品服务，然后由商品服务保存文件。这种方式简单明了，但是存在单点故障风险，因为所有文件都在同一台服务器上存储。分布式情况下的普通上传：这是一种改进后的版本，多个商品服务共享同一个文件存储空间。然而，这种方案仍然需要自己维护文件

CSS学习笔记

ngczx的博客

07-23

655

CSS学习笔记

Mysql数据库笔记

m0_64346512的博客

07-25

721

mysql基础笔记

Live555源码阅读笔记：哈希表的实现(C++)

wkd_007的博客

07-24

872

👉本文介绍了Live555的哈希表实现，最后给出了使用例子，对于想了解哈希表实现或Live555源码的同学有一定的帮助。

[ONVIF系列 - 01] 简介 - 设备发现 - 相关工具

含光左卫的工作笔记集

07-25

951

ONVIF服务端的实现，笔记和代码。

鸿蒙开发笔记07--自定义组件

m0_64346512的博客

07-25

230

07-30

python实现的基于蒙特卡洛树搜索(MCTS)与UCT 的五子棋游戏的代码

06-06

好的，以下是一个基于Python实现的基于MCTS和UCT的五子棋游戏AI的代码示例： ``` python import random import math class TreeNode: def __init__(self, state, parent=None): self.state = state self.parent = parent self.children = [] self.visits = 0 self.score = 0 def UCT(node): C = 1.4 if node.visits == 0: return float('inf') return (node.score / node.visits) + C * math.sqrt(math.log(node.parent.visits) / node.visits) def MCTS(state, iterations): root = TreeNode(state) for i in range(iterations): node = root # selection while node.children: node = max(node.children, key=UCT) # expansion if node.visits > 0: moves = node.state.get_moves() for move in moves: if move not in [c.state.last_move for c in node.children]: child_state = node.state.apply_move(move) child_node = TreeNode(child_state, node) node.children.append(child_node) # simulation sim_node = node while sim_node.children: sim_node = random.choice(sim_node.children) score = simulate(sim_node.state) # backpropagation while node: node.visits += 1 node.score += score node = node.parent return max(root.children, key=lambda c: c.visits).state.last_move def simulate(state): player = state.get_current_player() while not state.is_terminal(): move = random.choice(state.get_moves()) state = state.apply_move(move) player = state.get_current_player() if state.get_winner() == player: return 1 elif state.get_winner() == None: return 0.5 else: return 0 class Board: def __init__(self, width=15, height=15, win_length=5): self.width = width self.height = height self.win_length = win_length self.board = [[None for y in range(height)] for x in range(width)] self.last_move = None def get_moves(self): moves = [] for x in range(self.width): for y in range(self.height): if self.board[x][y] == None: moves.append((x, y)) return moves def apply_move(self, move): x, y = move player = self.get_current_player() new_board = Board(self.width, self.height, self.win_length) new_board.board = [row[:] for row in self.board] new_board.board[x][y] = player new_board.last_move = move return new_board def get_current_player(self): if sum(row.count(None) for row in self.board) % 2 == 0: return "X" else: return "O" def is_terminal(self): if self.get_winner() != None: return True for x in range(self.width): for y in range(self.height): if self.board[x][y] == None: return False return True def get_winner(self): for x in range(self.width): for y in range(self.height): if self.board[x][y] == None: continue if x + self.win_length <= self.width: if all(self.board[x+i][y] == self.board[x][y] for i in range(self.win_length)): return self.board[x][y] if y + self.win_length <= self.height: if all(self.board[x][y+i] == self.board[x][y] for i in range(self.win_length)): return self.board[x][y] if x + self.win_length <= self.width and y + self.win_length <= self.height: if all(self.board[x+i][y+i] == self.board[x][y] for i in range(self.win_length)): return self.board[x][y] if x + self.win_length <= self.width and y - self.win_length >= -1: if all(self.board[x+i][y-i] == self.board[x][y] for i in range(self.win_length)): return self.board[x][y] return None def __str__(self): return "\n".join(" ".join(self.board[x][y] or "-" for x in range(self.width)) for y in range(self.height)) if __name__ == "__main__": board = Board() while not board.is_terminal(): if board.get_current_player() == "X": x, y = map(int, input("Enter move (x y): ").split()) board = board.apply_move((x, y)) else: move = MCTS(board, 1000) print("AI move:", move) board = board.apply_move(move) print(board) print("Winner:", board.get_winner()) ``` 该代码定义了一个 `TreeNode` 类来保存节点的状态和统计信息，实现了基于UCB公式的UCT算法和基于MCTS和UCT的五子棋AI。同时，代码还定义了一个 `Board` 类来表示五子棋游戏的状态和规则，并实现了判断胜负、获取可行落子位置等方法。在 `__main__` 函数中，代码通过交替输入玩家落子位置和调用AI选择落子位置的方式，实现了人机对战的功能。希望这个代码对你有所帮助！

博客摘录「 【python】蒙特卡洛树搜索（MCTS）简单实现」2023年10月24日

博客摘录「【python】蒙特卡洛树搜索（MCTS）简单实现」2023年10月24日