假设高维度数据满足高斯分布的合理性

机器学习中常假设高维数据近似高斯分布,这可通过中心极限定律理解。棣莫佛-拉普拉斯、林德伯格-列维及林德伯格-费勒定理分别阐述了在特定条件下,独立随机变量序列的标准化趋于标准正态分布,解释了现实数据的高斯特性。这一理论在Andrew Ng的《机器学习》教程中也有提及,因此在高斯模型等分析中假设高斯分布是合理的。
摘要由CSDN通过智能技术生成

初学机器学习,老是对假设高维度数据的分布近似满足高斯分布或者正态分布表示不解。维基百科中介绍的中心极限定律给予这个现象以合理的解释。以下公式和推理摘自维基百科中的推导。这三个定理分层次递进的介绍了,满足一定条件时,独立,但不同分布的随机变量序列的标准化和以标准正态分布为极限。所以现实生活中,很多数据都无独有偶的表现出了近似高斯分布的性质。因为现实世界里的很多事物都是通过大量独立不同分布的随机变量所展现的。

这些在斯坦福《机器学习》教程中,Andrew Ng也曾介绍过。所以有些以高斯分布为基础的分析模型,如高斯模型和高斯混合模型中都假设了数据满足高斯分布,这是合理的。微笑

棣莫佛-拉普拉斯定理

棣莫佛-拉普拉斯(de Movire - Laplace)定理是中心极限定理的最初版本,讨论了服从
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值