正态分布简介
你听说过钟形曲线吗?它往往是全球人中讨论最多的水冷却器主题之一。长期以来,钟形曲线决定了对员工的专业评估,这是一个受欢迎或令人恐惧的话题,具体取决于与谁交谈!
看一下这张图片:
您认为曲线的形状表示什么?作为数据科学家(或有抱负的人),您应该能够一口气回答这个问题。在许多其他应用程序中,钟形曲线背后的想法是正态分布。
正态分布是统计的核心概念,统计是数据科学的基础。在进行探索性数据分析时,我们首先探索数据并旨在找到其概率分布,对吗?猜猜是什么-最常见的概率分布是正态分布。
查看以下三个非常常见的正态分布示例:
您可以清楚地看到,出生权重,智商得分和股票价格回报通常形成钟形曲线。同样,遵循正态分布的还有许多其他社交和自然数据集。
正态分布对于数据科学家来说必不可少的另一个原因是中央极限定理。该定理解释了数学的魔术性,是假设检验技术的基础。
在本文中,我们将了解正态分布的重要性和不同属性,以及如何使用这些属性检查数据的正态性。
目录
- 正态分布的性质
- 正态分布的经验法则
- 什么是标准正态分布?
- 熟悉偏斜的分布
- 左偏分布
- 右偏分布
- 如何检查分布的正态性
-
- 直方图
- KDE图
- Q_Q图
- 偏度
- 峰度
-
- 用于实现和理解正态分布的Python代码
正态分布的性质
我们将此钟形曲线称为正态分布。卡尔·弗里德里希·高斯发现了它,因此有时我们也称其为高斯分布。
我们可以仅使用两个参数 Mean和 2来简化正态分布的概率密度。该曲线围绕均值对称。同样如您所见,对于这种分布,均值,中位数和众数都相同。
正态分布的另一个重要现象是,它始终保持正态形状,这与其他在变换后会改变其特性的概率分布不同。对于正态分布:
- 产品两个正态分布结果成正态分布
- 两个正态分布的总和为正态分布
- 两个正态分布的卷积也是正态分布
- 正态分布的傅立叶变换也是正态的
开始意识到这个不可思议的概念