高斯分布基础知识及scipy实现

概率密度函数(pdf)

随机变量 X X X的高斯分布的概率密度函数(probability density function,pdf):
f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ < x < ∞ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}},-\infty<x<\infty f(x)=2π σ1e2σ2(xμ)2,<x<
其中 μ , σ ( σ > 0 ) \mu,\sigma(\sigma>0) μ,σ(σ>0)为常数,记为 X ∼ N ( μ , σ ) X\sim N(\mu,\sigma) XN(μ,σ)

累计分布函数(cdf)

高斯分布的累积分布函数(Cumulative distribution function,cdf)为:
F ( x ) = 1 2 π σ ∫ − ∞ x e − ( t − μ ) 2 2 σ 2 d t F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^{2}}{2\sigma^{2}}}dt F(x)=2π σ1xe2σ2(tμ)2dt
求的为高斯分布的曲线在 X < x X<x X<x下的面积,也就是概率 P { X < x } P\{X<x\} P{X<x}

特别的,如果 X ∼ N ( 0 , 1 ) X\sim N(0,1) XN(0,1)服从标准高斯分布,则 F ( x ) F(x) F(x)记为 Φ ( x ) \Phi(x) Φ(x):
Φ ( x ) = 1 2 π σ ∫ − ∞ x e − t 2 2 d t \Phi(x)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{t^{2}}{2}}dt Φ(x)=2π σ1xe2t2dt

引理:若 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^{2}) XN(μ,σ2),则 Z = X − μ σ ∼ N ( 0 , 1 ) Z=\frac{X-\mu}{\sigma}\sim N(0,1) Z=σXμN(0,1)
于是,若 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^{2}) XN(μ,σ2),其分布函数可以写为
F ( x ) = P ( X < x ) = P ( X − μ σ < x − μ σ ) = Φ ( x − μ σ ) F(x)=P(X<x)=P(\frac{X-\mu}{\sigma}<\frac{x-\mu}{\sigma})=\Phi(\frac{x-\mu}{\sigma}) F(x)=P(X<x)=P(σXμ<σxμ)=Φ(σxμ)

期望

根据连续性概率密度函数的期望的定义:
E ( X ) = ∫ − ∞ ∞ x f ( x ) d x E(X)=\int_{-\infty}^{\infty}xf(x)dx E(X)=xf(x)dx
∫ − ∞ ∞ x f ( x ) d x = ∫ − ∞ ∞ x 1 2 π σ e − ( x − μ ) 2 2 σ 2 d x = ∫ − ∞ ∞ ( x − μ + μ ) 1 2 π σ e − ( x − μ ) 2 2 σ 2 d x = ∫ − ∞ ∞ ( x − μ ) 1 2 π σ e − ( x − μ ) 2 2 σ 2 d x + ∫ − ∞ ∞ μ 1 2 π σ e − ( x − μ ) 2 2 σ 2 d x = − σ 2 ∫ − ∞ ∞ 1 2 π σ e − ( x − μ ) 2 2 σ 2 d ( − ( x − μ ) 2 2 σ 2 ) + μ ∫ − ∞ ∞ 1 2 π σ e − ( x − μ ) 2 2 σ d x = − σ 2 π σ e − ( x − μ ) 2 2 σ 2 ∣ − ∞ ∞ + μ F ( ∞ ) \int_{-\infty}^{\infty}xf(x)dx=\int_{-\infty}^{\infty}x\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}dx \\=\int_{-\infty}^{\infty}(x-\mu+\mu)\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}dx \\=\int_{-\infty}^{\infty}(x-\mu)\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}dx+\int_{-\infty}^{\infty}\mu\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}dx\\ =-\sigma^{2}\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}d(-\frac{(x-\mu)^{2}}{2\sigma^{2}})+\mu\int_{-\infty}^{\infty}\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma}}dx\\ =\frac{-\sigma}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}|_{-\infty}^{\infty}+\mu F(\infty) xf(x)dx=x2π σ1e2σ2(xμ)2dx=(xμ+μ)2π σ1e2σ2(xμ)2dx=(xμ)2π σ1e2σ2(xμ)2dx+μ2π σ1e2σ2(xμ)2dx=σ22π σ1e2σ2(xμ)2d(2σ2(xμ)2)+μ2π σ1e2σ(xμ)2dx=2π σσe2σ2(xμ)2+μF()
若求解区间为 ( − ∞ , ∞ ) (-\infty,\infty) (,),则期望 E ( X ) = 0 + μ = μ E(X)=0+\mu=\mu E(X)=0+μ=μ
若求解区间为 ( − ∞ , 0 ) (-\infty,0) (,0),则为计算条件期望 E ( X ∣ X < 0 ) = ∫ − ∞ 0 x f ( x ) d x F ( 0 ) = ∫ − ∞ 0 x f ( x ) d x ∫ − ∞ 0 f ( x ) d x = − σ 2 π σ e − μ 2 2 σ 2 + μ Φ ( 0 − μ σ ) Φ ( 0 − μ σ ) = μ + − σ 2 π σ Φ ( 0 − μ σ ) e − μ 2 2 σ 2 E(X|X<0)=\frac{\int_{-\infty}^{0}xf(x)dx}{F(0)}=\frac{\int_{-\infty}^{0}xf(x)dx}{\int_{-\infty}^{0}f(x)dx} \\=\frac{\frac{-\sigma}{\sqrt{2\pi}\sigma}e^{-\frac{\mu^{2}}{2\sigma^{2}}}+\mu\Phi(\frac{0-\mu}{\sigma})}{\Phi(\frac{0-\mu}{\sigma})}\\=\mu+\frac{-\sigma}{\sqrt{2\pi}\sigma \Phi(\frac{0-\mu}{\sigma})}e^{-\frac{\mu^{2}}{2\sigma^{2}}} E(XX<0)=F(0)0xf(x)dx=0f(x)dx0xf(x)dx=Φ(σ0μ)2π σσe2σ2μ2+μΦ(σ0μ)=μ+2π σΦ(σ0μ)σe2σ2μ2

scipy库对高斯分布的使用

参考文档:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.norm.html

这里介绍3个常用的函数:

pdf(x, loc=0, scale=1):x的概率密度函数值
cdf(x, loc=0, scale=1):x的累计分布函数值
ppf(q, loc=0, scale=1):对cdf的反转的,累计分布函数值对应的x
from scipy.stats import norm

print(norm.pdf(0))  # f(0)=0.3989422804014327
print(norm.cdf(0))  # F(0)=0.5
print(norm.ppf(0.5))  # F_inverse(0.5)=0
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页