目录 1.1 随机变量 1.2 蒙特卡洛估计 2.2.1 近似值 2.2.2 估算阴影部分面积 1.1 随机变量 随机变量和观测值是强化学习常用的两个概念。随机变量是一个不确定的量,它的值取决于一个随机事件的本身。而观测值表示观测到的结果。 例