一、为什么老出现正态分布?
正态分布又称为高斯分布,而正态的英文单词是“mormal”,意思是“常见的”。为什么机器学习中老出现正态分布?这主要是因为它能恰当代表多种多样的数据类型,如我们的考试成绩、身高的统计等。很多数据都符合正态分布,所以,它在数学、物理、工程领域有广泛的应用。
二、概率基础
1、数学期望:又称均值,表示一件事平均发生的概率,记为E(x),E(x) = x1p1+x2p2+...+ xnpn。或者
.
2、方差:用来刻画随机变量x和数学期望E(x)之间的偏离程度,记做D(x),
,
变换后可由下式来计算:
.
三、正态分布
1、正态分布:若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置(中心线),其标准差σ决定了分布的幅度(胖瘦)。正态分布有叫高斯分布。
2、标准正态分布:当μ = 0,σ = 1时的正态分布是标准正态分布。
3、正态分布图:
(本图引自:https://blog.csdn.net/fjssharpsword/article/details/70861817)
4、一维正太分布概率密度函数: .
四、正态分布性质
参考百度百科:https://baike.baidu.com/item/%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83/829892?fr=aladdin
参考资料:
1、百度百科.正态分布:https://baike.baidu.com/item/%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83/829892?fr=aladdin
2、CSDN.机器学习知识点(二十二)高斯分布(正态分布)基础知识:https://blog.csdn.net/fjssharpsword/article/details/70861817
3、知乎.为什么正态分布被广泛应用到统计学习的领域,而其他分布不行?其他的分布都主要有什么应用?:https://www.zhihu.com/question/33640554?sort=created