科普向-计算机如何生成随机数？（第二期）

Q.Y.N.829

于 2024-09-17 21:23:30 发布

阅读量161

点赞数 5

文章标签：算法学习 python

本文链接：https://blog.csdn.net/weixin_63470844/article/details/142317926

版权

一、引言

在上期中，我们介绍了LCG和逆变换法，了解了区间上的均匀分布，多点分布以及一些简单分布函数的生成。本期我们将把情况推向更为一般的情况，讲介绍正态分布的生成，以及舍选法生成一般概率分布函数的分布。

二、正态分布

对于正态分布 $N(0,1)$ 的概率密度和分布函数：

$p(x)d(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}$

$F(x)=\int_{-\infty}^{x}p(y)d(y)=\int_{-\infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-\frac{y^2}{2}}dy$

直接计算上述积分是不太容易的，因此利用在概率论中学习过的计算方法，我们考虑二维正态分布 $N(0,I_2)$ ,这个二维的正态分布的分布函数如下：

$\int_{\mathbb{R}^2}\frac{1}{2\pi}e^{-\frac{x^2}{2}}e^{-\frac{y^2}{2}}dxdy$

考虑极坐标变换： $x=rcos\theta ,\,\,\,y=rsin\theta, \,\,\,\text{at the same time:}\,\,dxdy=rdrd\theta$

可以得到：

$\int_{\mathbb{R}^2}\frac{1}{2\pi}e^{-\frac{x^2}{2}}e^{-\frac{y^2}{2}}dxdy=\int_{0}^{+\infty}dr\int_{0}^{2\pi}d\theta\frac{1}{2\pi}e^{-r^2}r=1$

受此启发, 就得到了Box-Muller变换原理：

$X \sim N(0,1),\,\,Y \sim N(0,1) \Rightarrow (X,Y) \sim N(0,I_2)$

做变换:

$\left\{\begin{matrix} X=Rcos\Theta \\ Y=Rsin\Theta \end{matrix}\right.\,\,\Rightarrow \Theta\sim \mathcal{U}[0,2\pi],\,\,R\sim Rayleigh$

$p(x,y)dxdy=\frac{1}{2\pi}d\theta \, e^{-\frac{r^2}{2}}rdr$

其中：

$\theta\sim \mathcal{U}[0,2\pi]\Rightarrow \int_{0}^{2\pi}d\theta=1\\\\\ F(r)=\int_{0}^{r}e^{-\frac{s^2}{2}}sdr=-e^{-\frac{s^2}{2}}|_0^r=1-e^{-\frac{r^2}{2}}\Rightarrow \,\,\int_{0}^{+\infty}e^{-\frac{s^2}{2}}sdr=1$

我们设 $1-e^{-\frac{r^2}{2}}=t$ ，可以反解出：

$1-e^{-\frac{r^2}{2}}=t \,\,\,\Rightarrow \,\,\,1-t=e^{-\frac{r^2}{2}}\,\,\,\Rightarrow \,\,\,r=\sqrt{-2logt}$

因此我们只需生成两个均匀分布： $\Theta_n \sim \mathcal{U}[0,2\pi]\quad T_n\sim \mathcal{U}[0,1]$ , 就可以得到 $R_n$ 以及 $X_n$ ：

$R_n=\sqrt{-2logT_n},\,\,\,X_n=R_ncos\Theta_n$

这样就生成了一维正态分布，事实上可以看成二维正态分布的一个切片。

所以我们利用这种方法其实是得到了一个二维正态分布：

$R_n=\sqrt{-2logT_n},\,\,\,X_n=R_ncos\Theta_n,\,\,\,Y_n=R_nsin\Theta_n$ 、

三、舍选法

1、舍选法介绍

舍选法的直观理解如下：

我们在 $[a,b]\times[0,c]$ 这个区域上生成均匀分布，之后只保留其中 $y \in [0,p(x)]$ 中的点，这样我们就生成了以 $p(x)$ 为概率密度的分布。

那么为什么上面的这个“去掉一个部分”的操作可以保证分布还是均匀的呢？换句话说 $p(x)$ 围成的区域中的点对于 $x$ 应该还是均匀的，这样才可以保证生成的是以 $p(x)$ 为概率密度的分布。下面的定理保证了这一点：

Thm 3,1

$\text{If} \,\,(X,Y) \sim \mathcal{X}_A(x,y)dxdy,\,\,\text{then}\,\,X\sim p(x)dx\\\\ \text{where }\mathcal{X}_A \,\,\text{is a Indicator function}\\\\p.f.\quad \text {Consider a marginal distribution} \,\,p(x) \\\\p(x)=\int_{\mathbb{R}}p(x,y)dy=\int_{0}^{p(x)}1dy=p(x) _{\quad \square }$