概率,概率分布,高斯分布,高维高斯分布


前言

高斯分布的理解, 它在低维和高维的形式。


一、概率与概率密度

两个基本的概念:

概率:在某事件出现某一结果的可能性大小。
分布:考虑事件的所有可能性 那么它就是分布。
分布函数,是概率统计中重要的函数,正是通过它,可用数学分析的方法来研究随机变量。分布函数是随机变量最重要的概率特征,分布函数可以完整地描述随机变量的统计规律,并且决定随机变量的一切其他概率特征。
概率密度: 概率指事件随机发生的机率,对于均匀分布函数,概率密度等于一段区间(事件的取值范围)的概率除以该段区间的长度,它的值是非负的,可以很大也可以很小。

概率密度函数:

1.1 定义:

如果对随机变量X的分布函数F(x),存在非负函数f(x),使得对于任意实数有:
F ( x ) = ∫ − ∞ x f ( t ) d t F(x)=\int_{-\infty}^xf(t)dt F(x)=xf(t)dt
则称X为连续型随机变量, 其中F(x)称为X的概率密度函数,简称概率密度。 ( f ( x ) ≥ 0 , 若 f ( x ) 在点 x 处连续 , 则 f ( x ) 是 F ( x ) 的导函数 ) (f(x)\geq 0,若f(x)在点x处连续,则f(x)是F(x)的导函数) (f(x)0,f(x)在点x处连续,f(x)F(x)的导函数)f(x)并没有很特殊的意义,但是通过其值的相对大小得知,若f(x)越大,对于相同长度的区间,X落到在这个区间的概率越大。

1.2 意义及通俗理解:
形象解释:

假设一个物体,问你它在某一点处的质量是多少?因为一个点是无限小的,所以点的质量一定是0。然而这个物体是由无数个点组成的,假设我们又需要求他的质量, 于是引入密度的概念:
ρ = lim ⁡ V → 0 Δ m Δ V \rho=\lim_{V\to0}\frac{\Delta m}{\Delta V} ρ=V0limΔVΔm
最后再对于密度积分就可以得到质量m了。
        同理,如果[0,1]上随机取点,求取在某一点处的概率, 点的长度无限小,此概率一定为0。此时的情况和上面所描述的类似,我们需要引入概率密度p, p = lim ⁡ x → 0 Δ p Δ x p=\lim_{x\to 0} \frac{\Delta p}{\Delta x} p=x0limΔxΔp 这样我们就可以求出所取点落在某一段(a,b)上的概率P了。 P = ∫ a b p ( t ) d t P=\int_a^bp(t)dt P=abp(t)dt
总结:
为什么要叫概率密度,因为它和物理上密度的定义本质上是一样的。

我们做题的时候一般就两种。
一.告诉你概率密度函数,让你求分布函数,积分就好了。
二.告诉你分布函数,让你求概率密度函数,求导就好了。
就像你做初中物理的密度题,无非两种:一.告诉你物体的密度让你求质量。二.告诉你物体的质量让你求密度

1.3.概率密度函数和概率的关系

  • 只有函数连续才有概率密度
  • 某一点的值是没有概率的
  • 某一段的概率: 设 F ( x ) 是概率分布函数 , F ( x ) = ∫ − ∞ x f ( t ) d t 其中 f ( x ) > 0 , 则乘 f ( x ) 为 x 的概率密度函数 ⇓ F ′ ( x ) = f ( x ) 设F(x)是概率分布函数,\\F(x)=\int_{-\infty}^xf(t)dt \\其中f(x)>0,则乘f(x)为x的概率密度函数\\\Downarrow\\F'(x)=f(x) F(x)是概率分布函数,F(x)=xf(t)dt其中f(x)>0,则乘f(x)x的概率密度函数F(x)=f(x)

简单记录 如有不懂的可以看一下这个:深度理解概率分布函数和概率密度函数

二、高斯分布是什么?

例如:从某校选取N名学生将他们的身高为x轴,人数量为y轴,进行直方图的绘画,则有:
在这里插入图片描述
当选取的人数足够多,间隔足够小的时候就会得到一个平滑的曲线:
在这里插入图片描述
定义: 若随机变量X的概率密度函数为:
f ( x ) = 1 2 π σ 2 e x p − 1 2 ( x − μ σ ) 2 − ∞ < x < ∞ f(x)=\frac{1}{\sqrt{2\pi \sigma^2}}exp{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2} \qquad -∞<x<∞ f(x)=2πσ2 1exp21(σxμ)2<x<
则称X服从正态分布,记做: X ∽ N ( μ , σ 2 ) X\backsim N(\mu,\sigma^2) XN(μ,σ2)
注:

  • x: 随机变量的取值
  • σ: 总体标准差; σ越大 曲线分布图越平缓, σ越小 曲线分布图越陡峭。
  • u: 总体均值
  • π=3.14159
  • e=2.71828

方差为σ2 -方差越小就越稳定
例如 : 一组数据为 [ x 1 , x 2 , . . . , x n ] , 它们的平均数为 x ˉ , σ 2 = ∑ i = 1 n ( x i − x ˉ ) 2 n 例如: 一组数据为[x_1,x_2,...,x_n], 它们的平均数为\bar{x}, \\ \sigma^2=\frac{\sum_{i=1}^n(x_i-\bar{x})^2}{n} 例如:一组数据为[x1,x2,...,xn],它们的平均数为xˉ,σ2=ni=1n(xixˉ)2

均值和标准差影响图形变化:
在这里插入图片描述 此时均值u小了 图形往左平移, σ会影响图像的陡峭程度。

3σ准则:
在这里插入图片描述
落入到每个区间的概率不同:
例如:落入到区间[-1σ,1σ] 的概率为68.2%; 落入到[-3σ,3σ]的概率为99.73%。
如果 d a t a t , μ + 2 σ < t < μ + 3 σ 则说明已经超过了 90 data \qquad t,\\ \mu+2σ<t<\mu+3σ\\则说明已经超过了90%的数据了 datat,μ+2σ<t<μ+3σ则说明已经超过了90
主要用于检测质量与数量的统计:
如果一个事件落入到[-3σ,3σ]意外的区间,则说明发生了小概率事件。

三 、高维高斯分布

正态分布推导过程

在这里插入图片描述


总结

参考引用:
1.高斯分布科普
2.多维高斯分布是如何由一维发展而来的?
3.高维高斯分布的简述
4.深度理解概率分布函数和概率密度函数

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值