理论解释:
中心极限定理(central limit theorem)
同样分布的随机变量,即使原始变量本身不是正态分布,标准化样本均值的抽样分布(求和取平均)趋向于标准正态分布。
均匀分布
另一个分布
任意分布
采样数量越多趋势越明显。
- 可以理解为每一个分布都有一个中心点。多次随机采样求平均,就会趋向中心点,变成中心分布
原因
自然界很多都是多个变量独立影响,影响的表现是多个影响和的平均。所欲很多都是正太分布。如身高、成绩、噪声等。
- 如果是乘积的影响,就不是正态分布了,如财富。但是可以对其取log变成求和,则变成正态分布
- 或者对其多次采样求平均,也会复合正态分布
参考:https://youtu.be/YAlJCEDH2uY?si=59DgWz_iruv9l3_N