目录
- 0. 引言
- 1. 引子——函数乘以自己也趋向于正态分布
- 2. 简单介绍中心极限定理
- 3. 如何构造乘积起来趋向于正态分布的函数
- 4. 函数卷积自己也趋向于正态分布
- 5. 结语
0、引言
冯诺依曼曾说过:
用四个参数我可以拟合出一头大象,用五个参数我可以让大象的鼻子晃一晃
通常而言,相对本质的东西,形式常常比较简洁,它们通常根据相对容易满足、常见的前提假设,推出一个很普适的结论。换言之,相对本质的东西通常对于许多情形都适用[1]。例如有名的熵增原理:
孤立系统中,熵总是会趋向于增加
在熵增原理中,我们前提是比较常见的——孤立系统,却推出来了熵增这样的比较普适的结论。
而概率的本质则是人的无知,因此,我们期望知道尽可能少的东西,就能获得相对普适的估计。例如大数定理揭示了:
我们做有限次实验,只要次数充分多,其频率就能趋近于概率
大数定理里面对你的对象究竟是什么样子没有要求,所以相对普适。
而中心极限定理则是一个更加神奇,它说明了——
个独立同分布 [2]的随机变量,如果他们的均值和方差均相同且有限[3],那么当充分大时,那么它们的平均值的概率分布趋向于 正态分布
高中数学课上,我们将
服从均值为0,方差为
的正态分布记为
。回忆一下高中课上讲的:若
,则概率密度函数为
对于刚才中心极限定理的描述,我们只进行了一个定性的描述,下面我们来定量地描述中心极限定理——
不妨假设个独立随机变量的均值为0[4],令,方差,则当充分大时,随机变量的概率分布趋向于正态分布
这是一个神奇的现象,用人话说,就是——随便你是啥分布,只要你们独立,加起来就得服从正态分布。
这一点就与熵增原理有一些类似,它没有要求你是什么系统,不管什么系统,熵都会自己增加。而中心极限定理也是类似的,不管是什么分布,加起来都会自动趋向于正态分布。就仿佛冥冥之中有一双手一般,无论你是什么,都会被引导走向正态分布的终点。
为了直观地显示这一点,下面我以
取值为1、-1的概率均为0.5
为例子,用MATLAB做了关于
的概率分布的两个动图——
当试验次数充分多(取100000次),增大独立随机变量数目
(
用于说明中心极限定理)
MATLAB代码如下:
N = 100000; % 100000次试验
f = zeros(1,N); % 随机变量
M_array=[1,2,3,4,5,...
6,7,8,9,10,...
15,20,25,30,40,...
50,60,70,80,90,100];
for i=M_array
x = -i:2:i; % 横坐标
y = zeros(1,i+1); % 随机变量
for j=1:N % 生成100000次试验
temp=rand(1,i); % 0-1均匀分布
% 大于0.5视为1,小于0.5视为-1.求和
f(j)=sum(temp>0.5)-sum(temp<0.5);
y((f(j)+i)/2+1) = y((f(j)+i)/2+1)+1;
end
stem(x,y);title(['独立随机变量数为',num2str(i)]);
I=frame2im(getframe(gcf));
[I,map]=rgb2ind(I,256);
if i == M_array(1)
imwrite(I,map,'充分多试验_增大独立随机变量数.gif','gif', 'Loopcount',inf,'DelayTime',0.3);
else
imwrite(I,map,'充分多试验_增大独立随机变量数.gif','gif','WriteMode','append','DelayTime',0.3);
end
end
固定增大独立随机变量数目
,逐渐增大试验次数(
用于说明大数定理)