深度强化学习_蒙特卡洛算法王树森课程笔记

最新推荐文章于 2024-04-11 18:17:46 发布

淀粉爱好者

最新推荐文章于 2024-04-11 18:17:46 发布

阅读量536

点赞数

文章标签：算法概率论深度学习机器学习

本文链接：https://blog.csdn.net/weixin_44005728/article/details/125004343

版权

💡 随机算法，通过随机样本估算真实值。

一、 Calculate $\pi$

用蒙特卡洛近似估算出 $\pi$ 的值

在这里插入图片描述

随机生成平面坐标系中的点 $(x,y),\space x\in[-1,1],\space y\in[-1,1]$ ， $x,\space y$ 为 $[- 1, 1]$ 之间的均匀分布，所有的点都有相同的概率密度；
正方形内切圆半径为1，随机样本落在圆内的概率=圆的面积/正方形的面积： $P=\frac{\pi}{4}$ ；
从正方形区域均匀随机抽样 ${\color{d44d37}n}$ 个点，在圆内的点的数量期望为 $P{\color{d44d37}n}=\frac{\pi{\color{d44d37}n}}{4}$ ;
- 已知坐标 $(x, y)$ 判断是否在圆内：若 $x^2+y^2\le1$ 则在圆内。
均匀随机抽样后有 ${\color{d44d37}m}$ 个点在圆内，若 ${\color{d44d37}n}$ 非常大，则真实观测值 ${\color{d44d37}m}\approx\frac{\pi{\color{d44d37}n}}{4}$ ；
即得到 $\pi\approx\frac{4{\color{d44d37}m}}{{\color{d44d37}n}}$ ；
大数定律保证蒙特卡洛的正确性： $\frac{4{\color{d44d37}m}}{{\color{d44d37}n}}\rightarrow\pi,\space \text{as}\space {\color{d44d37}n}\rightarrow\infty$ 。

【结论】：从如图正方形中均匀抽样 ${\color{d44d37}n}$ 个点，观测到 ${\color{d44d37}m}$ 个点落在内切圆中，可近似得到 $\pi\approx\frac{4{\color{d44d37}m}}{{\color{d44d37}n}}$ 。

近似估算 $\pi$ 值

在纸上画几条距离为 ${\color{337ea9}d}$ 的平行线；
准备一些长度为 ${\color{337ea9}l}$ 的针；
随机将针抛到纸上，针可能与平行线相交也可能不相交；
假设针的位置和角度都是均匀随机的，通过微积分算出相交的概率 $P=\frac{2{\color{337ea9}l}}{\pi{\color{337ea9}d}}$ ；
随机往纸上扔 ${\color{d44d37}n}$ 根针，与平行线相交的针的数量期望为 $P{\color{d44d37}n}=\frac{2{\color{337ea9}l}{\color{d44d37}n}}{\pi{\color{337ea9}d}}$ ；
真实观测到有 ${\color{d44d37}m}$ 根针与平行线相交，若 ${\color{d44d37}n}$ 非常大，则真实观测值 ${\color{d44d37}m}\approx\frac{2{\color{337ea9}l}{\color{d44d37}n}}{\pi{\color{337ea9}d}}$ ；
即得到 $\pi\approx\frac{2{\color{337ea9}l}{\color{d44d37}n}}{{\color{d44d37}m}{\color{337ea9}d}}$ 。

在这里插入图片描述

对如图正方形区域内做均匀随机抽样得到多个点，判断点是否在阴影部分需满足两个条件；
- 在圆内： $(x-1)^2+(y-1)^2\le1$ ；
- 不在扇形内： $x^2+y^2\ge4$ ；
假设阴影部分面积为 $A$ ，随机抽样的点落在阴影部分的概率为 $P=\frac{A}{4}$ ；
均匀随机抽样 ${\color{d44d37}n}$ 个点，点落在阴影部分的期望为 $P{\color{d44d37}n}=\frac{A{\color{d44d37}n}}{4}$ ；
真实观测到有 ${\color{d44d37}m}$ 个点落在阴影部分，若 ${\color{d44d37}n}$ 非常大，则真实观测值 ${\color{d44d37}m}\approx\frac{A{\color{d44d37}n}}{4}$ ；
即得到 $A\approx\frac{4{\color{d44d37}m}}{{\color{d44d37}n}}$ 。

Task：求 $I=\int^a_bf(x)dx$ 。

Task：给出多元函数 $f(\bold x)$ ，其中向量 $\bold x\in\Bbb R^d$ ，求函数在集合 $\Omega$ （ $\Omega \subset \Bbb R^d$ ）上的定积分： $I=\int _\Omega f(\bold x)d\bold x$ 。

随机抽样：从集合 $\Omega$ 中均匀抽取 $n$ 个样本，记作 $\bold x_1,\dots,\bold x_n$ ；
计算集合 $\Omega$ 的体积： $V=\int_\Omega d\bold x$ ；
- 求体积 $V$ 也需要定积分，有可能与原问题同样困难，因此需要让集合 $\Omega$ 是简单的形状（长方体、球体等），用公式直接计算出体积，避免积分运算。
计算 $Q_n=V\cdot\frac{1}{n}\sum^n_{i=1}f(\bold x_i)$ ；
$Q_n$ 即为积分 $I=\int _\Omega f(\bold x)d\bold x$ 的近似估计。

定义 ${\color{d44d37}X}$ 为 $d$ 维随机变量；
定义 ${\color{orange}p(\bold x)}$ 为概率密度函数；
- 性质： $\int_{\Bbb R^d}{\color{orange}p(\bold x)}d\bold x=1$ （连续分布）。
函数 $f(\bold x)$ 的期望： $\Bbb E_{{\color{d44d37}X}\sim{\color{orange}p}}[f({\color{d44d37}X})]=\int_{\Bbb R^d}f(x)\cdot{\color{orange}p(\bold x)}d\bold x$ ；
首先随机抽样：（注意此处不是均匀抽样）根据概率密度函数 ${\color{orange}p(\bold x)}$ 随机抽取 $n$ 个样本，记作 $\bold x_1,\dots,\bold x_n$ ；
计算 $Q_n=\frac{1}{n}\sum^n_{i=1}f(\bold x_i)$ ；
$Q_n$ 即为对期望 $\Bbb E_{{\color{d44d37}X}\sim{\color{orange}p}}[f({\color{d44d37}X})]$ 的估计。（样本数量 $n$ 越大，蒙特卡洛估计越准确）