一、实现 Expectimax
期望最大(Expectimax)是在 MINIMAX 的基础上进行了概率的计算,这个最开始我还是很没有理解的,后来和叶老师与111173田鑫讨论后才悟了,如图 1:
![](https://img-blog.csdnimg.cn/img_convert/6f04ba75120e1e3dc38895d9912331ff.png)
![](https://img-blog.csdnimg.cn/img_convert/e3ad4e9f3c87bd7afc8162d5e0a470c8.png)
图 1 一颗普通的状态树 图 2 新的计算公式 这一层原本是 MINI 层,按照原来的算法,应该在其子节点中选择一个最小值传递到上一层,因此结果应该是-12。但现在添加了到达每个节点的概率,计算的方式就变成了求期望值,即图 2 的公式。其中 p 表示概率,value 该点的值。这样一来,该点的值就是 8 * 1/2+ 1/3 + -12 * 1/6 = 10