高斯分布与概率密度函数

最新推荐文章于 2025-04-10 10:08:59 发布

海棠未语

最新推荐文章于 2025-04-10 10:08:59 发布

阅读量2.8k

点赞数 13

分类专栏：数学知识文章标签：概率论机器学习人工智能算法学习

本文链接：https://blog.csdn.net/qq_43016560/article/details/141356919

版权

数学知识专栏收录该内容

13 篇文章

订阅专栏

一、均值、方差、标准差

1. 均值（Mean）：

均值是数据集中所有数值的总和除以数值的个数。
它是数据集中所有数据点的平均水平或中心位置。
均值的计算公式为：均值 $(\mu)= \frac{1}{N}\sum_{i=1}^N x_i$ ,其中 $N$ 是数据点的总数, $x_i$ 是每个数据点。

2. 方差（Variance）：

方差是衡量数据点偏离均值的一种度量。
它表示每个数据点与均值的差的平方的平均值，反映了数据的离散程度。
方差的计算公式为：方差 $(\sigma^2)=\frac{1}{N}\sum_{i=1}^N (x_i -\mu)^2$ ，其中 $\mu$ 是均值。

3. 标准差（Standard Deviation）：

标准差是方差的平方根，它与原始数据具有相同的单位。
标准差提供了数据集中数值相对于均值的离散程度的度量。
标准差的计算公式为：标准差 $(\sigma)=\sqrt{方差} =\sqrt{\frac{1}{N}\sum_{i=1}^N (x_i -\mu)^2}$

均值、方差和标准差共同提供了对数据集的全面描述：

均值给出了数据集的中心趋势。
方差和标准差提供了数据集的离散程度或变异性的度量。
在正态分布中，均值、方差和标准差是描述分布形状的关键参数。

标准差越大，数据点相对于均值的离散程度越大，即数据点分布得更广。标准差越小，数据点越集中，离散程度越小，即数据点更接近均值。

在实际应用中，均值可以告诉我们数据集的一般水平，而标准差则告诉我们数据点通常偏离这个水平多远。方差虽然提供了相同的信息，但由于其单位是原始数据单位的平方，因此在解释上不如标准差直观。

二、概率密度函数

概率密度函数（Probability Density Function，PDF）是连续型随机变量分布的描述方式。对于一个连续型随机变量
$X$ ，其概率密度函数 $f (x)$ 定义如下：

非负性：对于所有的 $x$ ,有 $f(x)\geq0$ 。
归一性：概率密度函数在整个定义域上的积分等于1，即： $\int_{-\infty}^{+\infty} f(x)dx=1$
概率的计算：随机变量 $X$ 在区间 $[a, b]$ 内取值的概率等于该区间上概率密度函数的积分，即：
$\leq X \leq b) = \int_{a}^{b} f(x)dx$

概率密度函数的图形可以提供随机变量分布的视觉表示。例如，正态分布的概率密度函数图形是一个对称的钟形曲线，其均值决定了曲线的中心位置，标准差决定了曲线的宽度。

不同类型的连续型随机变量有不同的概率密度函数。以下是一些常见的概率密度函数的例子：

均匀分布：如果随机变量 $X$ 在区间 $[a, b]$ 上是均匀分布的，其概率密度函数为：
$\begin{cases} \frac{1}{b-a},&\text{ for $a \leq x \leq b$ }\\ 0,&\text{otherwise} \end{cases}$
正态分布（高斯分布）：正态分布的概率密度函数为：
$f(x)=\frac{1}{\sigma\sqrt{2\pi}}exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)$
其中， $\mu$ 是均值， $\sigma$ 是标准差
指数分布：指数分布的概率密度函数为：
$f(x)=\lambda e^{-\lambda x}$
其中， $\lambda$ 是分布的参数，且 $x\geq 0$

三、高斯分布简介及定义

正态分布（Normal distribution），也称“常态分布”，又名高斯分布（Gaussian distribution），最早由棣莫弗（Abraham de Moivre）在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布，在统计学的许多方面有着重大的影响力。

若随机变量 $X$ 服从一个数学期望为 $\mu$ 、方差为 $\sigma^2$ 的正态分布，记为 $N (μ ， σ 2)$ 。其概率密度函数为正态分布的期望值 $\mu$ 决定了其位置，其标准差 $\sigma$ 决定了分布的幅度。当 $\mu = 0,\sigma = 1$ 时的正态分布是标准正态分布。

一维正态分布

若随机变量 $X$ 服从一个位置参数为 $\mu$ 、尺度参数为 $\sigma$ 的概率分布，且其概率密度函数为
$f(x)=\frac{1}{\sigma\sqrt{2\pi}}exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)$

则这个随机变量就称为正态随机变量，正态随机变量服从的分布就称为正态分布，记作 $X\sim N(\mu,\sigma^2)$ ，读作 $X$ 服从 $N(\mu,\sigma^2)$ ，或 $X$ 服从正态分布。

标准正态分布

当 $\mu = 0,\sigma = 1$ 时的正态分布是标准正态分布

$f(x)=\frac{1}{\sqrt{2\pi}}exp\left(-\frac{(x^2}{2}\right)$

四、正态分布的性质

在这里插入图片描述

曲线在 $x$ 轴的上方，与 $x$ 轴不相交；
曲线是单峰的，它关于直线 $x=\mu$ 对称；
曲线在 $x=\mu$ 处达到峰值 $\frac{1}{\sigma\sqrt{2\pi}}$ ；
曲线与 $x$ 围成的面积是1；
当 $\sigma$ 一定时，曲线的位置由 $\mu$ 确定，随着 $\mu$ 的变化沿着 $x$ 轴平移；
由于曲线与 $x$ 围成的面积是固定的，那么当 $\mu$ 一定时，曲线的形状就由 $\sigma$ 确定， $\sigma$ 越小（越集中），曲线就高瘦， $\sigma$ 越大（越分散），曲线就矮胖。

3 $\sigma$ 原则

“小概率事件”和假设检验的基本思想：“小概率事件”通常指发生的概率小于5%的事件，认为在一次试验中该事件是几乎不可能发生的。由此可见X落在（μ-3σ,μ+3σ）以外的概率小于千分之三，在实际问题中常认为相应的事件不会发生，基本上可以把区间（μ-3σ,μ+3σ）看作是随机变量X实际可能的取值区间，这称之为正态分布的“3σ”原则。
在这里插入图片描述
高斯分布作为分布特性的一种，首先是用来描述统计对象的，如果统计对象的分布特性符合高斯分布，那么所有针对高斯分布的定理和“经验值”就能够直接套用。而高斯分布本身在自然界的应用是非常广泛的，用一句话解释高斯分布所表现的分布特点就是“一般般的很多，极端的很少”。
$p(\mu-\sigma \leq X \leq \mu+\sigma ）\approx 0.6826 \\ p(\mu-2\sigma \leq X \leq \mu+2\sigma ）\approx 0.9544 \\ p(\mu-3\sigma \leq X \leq \mu+3\sigma ）\approx 0.9974$