正态分布？

FSYo

已于 2022-01-20 17:09:08 修改

阅读量454

点赞数

分类专栏：数学文章标签：概率论

于 2021-09-05 23:28:19 首次发布

本文链接：https://blog.csdn.net/sslz_fsy/article/details/120123075

版权

数学专栏收录该内容

33 篇文章 1 订阅

订阅专栏

全是个人理解

正态分布是一种广泛出现的连续概率分布，比如身高，分数

二项分布是离散情况下的概率分布
比如仍硬币，正面的可能性是 $p$ ，那么仍 $n$ 次， $x$ 次正面的概率为 $\binom nxp^x(1-p)^{n-x}$
容易得到均值 $\mu=np$ ，方差 $\sigma^2=np(1-p)$
并且画柱状图画出来就是钟形，而且和正态分布的概率密度函数特别像

对于均值为 $\mu$ 方差为 $\sigma^2$ 的正态分布长成这个样子
$N(\mu,\sigma^2)=\frac{1}{\sqrt {2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}}$
接着发现，不妨设二项分布的 $p=\frac 12$ ，选择一个 $n$ ，带入 $\sigma^2=np(1-p)=\frac n4$
然后画出图像，是几乎重合的，比如选择 $n = 16$ ，我们知道 $\frac{\binom{16}8}{2^{16}}=0.196381$ 是二项分布的最中间的值，而将 $x=\mu$ 带入正态分布的函数可以知道这个点的概率密度是 $\frac{1}{2\sqrt{2\pi}}=0.1994711$ 是几乎相等的
而这个现象在 $n$ 更大的时候更明显（更接近连续）
例如 $\frac{\binom{36}{18}}{2^{36}}=0.13206$ ，而 $\frac{1}{3\sqrt {2\pi}}=0.132981$
这启示我们好像可以用 $\sqrt{\frac{1}{n\pi}}$ 来估计 $\frac{\binom{2n}{n}}{2^{2n}}$
很牛的是，斯特林公式告诉我们
$n!\sim \sqrt{2\pi n}(\frac{n}{e})^n$ ，如果我们来算一下 $\frac{\binom{2n}{n}}{2^{2n}}\sim\frac{2\sqrt {\pi n}(\frac{n}{e})^{2n}}{2\pi n(\frac{n}{e})^{2n}}=\sqrt{\frac{1}{n\pi}}$
之前在寻找人们是怎么拟合出正态分布函数的表达式的
就浏览到一个用斯特林公式推的，上面的巧合似乎告诉我们用斯特林公式推挺有道理
还有一种方法
考虑从 $[0, 1]$ 随机一些数出来，随机 $n$ 次，然后我们取平均，设为 $x_1$
然后我们重复上面过程 $m$ 次，把随出来的值（取平均后）看成 $x_2,\dots,x_m$
$m$ 足够大的时候，可以画出来一个概率密度函数，这个函数其实就是正态分布了
就是说在中间的概率要大很多（中心极限定理）
这感觉起来很正确，但为啥函数会长成 $e^{kx^2}$ 这种鬼样子呢？
我们先设一个函数，将其取名为误差密度函数 $f (x)$
$\prod_{i=1}^mf(x-x_i)$ ，并且真正的均值 $\overline x$ 是上面这个关于 $x$ 函数的极大值点
但经验告诉我们其实均值就是 $\overline x=\frac{\sum x_i}{m}$
而上面那个函数的极大值点，即 $\sum \ln f(x-x_i)$ 的极大值点，就是使 $\sum \ln f(x-x_i)'=\sum \frac{f'(x-x_i)}{f(x-x_i)}=0$ 的点，设 $g_i(x)=\frac{f'(x)}{f(x)}$ ，我们知道 $\sum g_i(\overline x-x_i)=0$
这个意思是说不管任意 $x_i$ 怎么变，上面都是 0，那么我们分别对 $x_1,\dots,x_m$ 求偏导，那么应该都是 0，可以解出来 $g (x) = k x$ ，我们发现 $f^{'} (x) = k x f (x)$ ，这启示我们 $f(x)=Ce^{\frac{kx^2}{2}}$
然后要调整积分为 1，最后就可以得到 $f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{x^2}{2\sigma^2}}$
看起来很牛逼，其实上面的 $L(x)=\prod f(x-x_i)$ 叫似然函数，就是利用均值既是多项的平均，又是似然函数的极值，从而导出 $f (x)$ 的性质

FSYo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
正态分布？

全是个人理解正态分布是一种广泛出现的连续概率分布，比如升高，分数二项分布是离散情况下的概率分布比如仍硬币，正面的可能性是 ppp，那么仍 nnn 次，xxx 次正面的概率为 (nx)px(1−p)n−x\binom nxp^x(1-p)^{n-x}(xn)px(1−p)n−x容易得到均值 μ=np\mu=npμ=np，方差 σ2=np(1−p)\sigma^2=np(1-p)σ2=np(1−p)并且画柱状图画出来就是钟形，而且和正态分布的概率密度函数特别像对于均值为 μ\muμ 方差为 σ2\
复制链接

扫一扫