概率,概率分布,高斯分布,高维高斯分布

最新推荐文章于 2024-09-04 17:56:13 发布

OwnResponsibility

最新推荐文章于 2024-09-04 17:56:13 发布

阅读量2.3k

点赞数 2

分类专栏：数学基础知识 SLAM 文章标签：概率论 python

本文链接：https://blog.csdn.net/qq_38757779/article/details/128759854

版权

SLAM 同时被 2 个专栏收录

6 篇文章 1 订阅

订阅专栏

数学基础知识

3 篇文章 0 订阅

订阅专栏

文章目录

前言
一、概率与概率密度
二、高斯分布是什么？
三、高维高斯分布
总结

前言

高斯分布的理解, 它在低维和高维的形式。

一、概率与概率密度

两个基本的概念:

概率:在某事件出现某一结果的可能性大小。
分布:考虑事件的所有可能性那么它就是分布。
分布函数，是概率统计中重要的函数，正是通过它，可用数学分析的方法来研究随机变量。分布函数是随机变量最重要的概率特征，分布函数可以完整地描述随机变量的统计规律，并且决定随机变量的一切其他概率特征。
概率密度: 概率指事件随机发生的机率，对于均匀分布函数，概率密度等于一段区间(事件的取值范围)的概率除以该段区间的长度，它的值是非负的，可以很大也可以很小。

概率密度函数:

1.1 定义:

如果对随机变量X的分布函数F(x),存在非负函数f(x),使得对于任意实数有:
$F(x)=\int_{-\infty}^xf(t)dt$
则称X为连续型随机变量, 其中F(x)称为X的概率密度函数,简称概率密度。 $(f(x)\geq 0,若f(x)在点x处连续,则f(x)是F(x)的导函数)$ f(x)并没有很特殊的意义,但是通过其值的相对大小得知,若f(x)越大,对于相同长度的区间,X落到在这个区间的概率越大。

1.2 意义及通俗理解:
形象解释:

假设一个物体,问你它在某一点处的质量是多少?因为一个点是无限小的,所以点的质量一定是0。然而这个物体是由无数个点组成的,假设我们又需要求他的质量, 于是引入密度的概念:
$\rho=\lim_{V\to0}\frac{\Delta m}{\Delta V}$
最后再对于密度积分就可以得到质量m了。
同理,如果[0,1]上随机取点,求取在某一点处的概率, 点的长度无限小,此概率一定为0。此时的情况和上面所描述的类似,我们需要引入概率密度p, $p=\lim_{x\to 0} \frac{\Delta p}{\Delta x}$ 这样我们就可以求出所取点落在某一段(a,b)上的概率P了。 $P=\int_a^bp(t)dt$
总结:
为什么要叫概率密度,因为它和物理上密度的定义本质上是一样的。
我们做题的时候一般就两种。
一.告诉你概率密度函数，让你求分布函数，积分就好了。
二.告诉你分布函数，让你求概率密度函数，求导就好了。
就像你做初中物理的密度题，无非两种:一.告诉你物体的密度让你求质量。二.告诉你物体的质量让你求密度

1.3.概率密度函数和概率的关系

只有函数连续才有概率密度
某一点的值是没有概率的
某一段的概率: $设F(x)是概率分布函数,\\F(x)=\int_{-\infty}^xf(t)dt \\其中f(x)>0,则乘f(x)为x的概率密度函数\\\Downarrow\\F'(x)=f(x)$

简单记录如有不懂的可以看一下这个:深度理解概率分布函数和概率密度函数

二、高斯分布是什么？

例如:从某校选取N名学生将他们的身高为x轴,人数量为y轴,进行直方图的绘画,则有:
在这里插入图片描述
当选取的人数足够多,间隔足够小的时候就会得到一个平滑的曲线:

定义: 若随机变量X的概率密度函数为:
$f(x)=\frac{1}{\sqrt{2\pi \sigma^2}}exp{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2} \qquad -∞<x<∞$
则称X服从正态分布,记做: $X\backsim N(\mu,\sigma^2)$
注:

x: 随机变量的取值
σ: 总体标准差; σ越大曲线分布图越平缓, σ越小曲线分布图越陡峭。
u: 总体均值
π=3.14159
e=2.71828

方差为σ² -方差越小就越稳定
$一组数据为[x_1,x_2,...,x_n], 它们的平均数为\bar{x}, \\ \sigma^2=\frac{\sum_{i=1}^n(x_i-\bar{x})^2}{n}$

均值和标准差影响图形变化:
在这里插入图片描述此时均值u小了图形往左平移, σ会影响图像的陡峭程度。

3σ准则:
在这里插入图片描述
落入到每个区间的概率不同:
例如:落入到区间[-1σ,1σ] 的概率为68.2%; 落入到[-3σ,3σ]的概率为99.73%。
如果 $\qquad t,\\ \mu+2σ<t<\mu+3σ\\则说明已经超过了90%的数据了$
主要用于检测质量与数量的统计:
如果一个事件落入到[-3σ,3σ]意外的区间,则说明发生了小概率事件。