源码:
链接:https://pan.baidu.com/s/1F9kyVM2OIrkBGTTh4aJODA .
提取码: une8
蒙特卡洛算法
例子
井字棋实现
1)以当前局面创建根节点
2)棋面剩余位置为子节点
3)因每个子节点访问为0,所以循环模拟每个子节点,然后反向传播,下一步在从根节点根据UCB进行选择,扩展,模拟,反向传播,直到训练结束
4)从当前棋面下用UCB选择下一步棋面进行落子
5)然后重复step1,step2,step3,step4直到游戏结束