概率基础Day10

KeKe_L

已于 2024-10-11 20:02:31 修改

阅读量516

点赞数 2

文章标签：学习 python 算法概率论

于 2024-10-11 20:01:47 首次发布

本文链接：https://blog.csdn.net/KeKe_L/article/details/142845091

版权

1.连续型随机变量及概率密度函数

频率密度直方图性质：

每个小长方形面积等于该组的频率，即频率密度x组距=频率/组距x组距=频率
所有长方形面积之和为1
介于x=a、x=b之间的面积近似于(a,b]的频率
当组距取得很小，形成一条光滑曲线，该曲线可看作概率密度函数

连续型随机变量的特点：

连续性：随机变量的取值是连续的，可以在一个或多个区间内取任意值。
不可数性：取值是不可数的，即有无限多个可能的取值。
概率分布：每个取值区间都有一个特定的概率，且整个取值范围的概率密度函数积分等于1。
连续型的随机变量取值在任意一点的概率都是0。在函数曲线上某个点的概率其实是取的该点附近值的大小。
连续情况下，端点无所谓。P{a≤x≤b}=P{a＜x＜b}

概率密度函数

对于一维实随机变量X，如果存在非负可积函数f(x)，使得对于任意实数x，在a≤x≤b上有

称f(x)为随机变量X的概率密度函数。

概率密度函数具有非负性（对于所有的f(x)≥0）和归一性（在取值范围内f(x)的积分为1）

#概率密度函数的积分其实就是求曲线在某个区间内的面积。

2.分布函数

累积分布函数（CDF）

对于随机变量 X，其累积分布函数 F(x) 定义为随机变量 X 取值小于或等于 x 的概率：

CDF具有

非减性（F(x1)≤F(x2)对于所有x1≤x2成立），
值域为1（0≤F(x)≤1），
边界条件为当x趋近负无穷时F(x)=0当x趋近正无穷时F(x)=1，
右连续：F(x) 在任意点 x 都是右连续的。对于离散型随机变量，F(x) 在任意点 x 是右连续，对于连续型随机变量，F(x) 在任意点 x 是连续的。

对于离散型随机变量：

CDF是阶梯式的，每个可能的取值点都有一个跳跃。

记作：

对于连续型随机变量：

CDF是概率密度函数的积分（PDF），并且是连续和光滑的（除非在某些点上有跳跃）。

记作：

分布函数其实就是求曲线在某个区间内的面积。

3.常见的分布

伯努利分布：描述单次试验成功或失败的概率，参数为成功的概率p。

x 可以是0或1，p 是成功（x=1）的概率， 1−p 是失败（x=0）的概率。

0-1分布式伯努利试验只做一次的分布函数，如果是n重伯努利试验，分布函数则为：

几何分布：描述首次成功前的试验次数，参数为单次试验成功的概率p。

其中：k 是获得第一次成功时试验的次数，

k=1,2,3,… p 是单次试验成功的概率。

1−p 是单次试验失败的概率。

二项分布：描述n次独立重复试验中成功次数的概率分布，参数为试验次数n和单次试验成功的概率p。记作 X∼B(n,p)。

其实就是事件概率中的伯努利公式。

k 取最接近 (n+1)p 的整数: 1. (n+1)p不为整数，则取最接近 (n+1)p 的整数为最大值。

2. (n+1)p为整数，则取 (n+1)p 和(n+1)p-1都是最大值。

泊松分布：描述单位时间或空间内事件发生次数的概率分布，参数为单位时间内事件平均发生的次数λ。

其中:

k 是事件发生的次数，k=0,1,2,…。 λ 是单位时间（或单位面积）内事件平均发生的次数。

均匀分布 描述在固定区间内各点取值概率相等的情况。

对于连续型随机变量 X，如果它服从区间 [a,b]上的均匀分布，其概率密度函数（PDF）为：

其中： a 是区间的下界。 b 是区间的上界。 b−a 是区间的长度。

累积分布函数（CDF）：

指数分布 描述两个连续事件发生之间的时间间隔的概率。

概率密度函数（PDF）：

x 是随机变量，表示事件发生的时间间隔。

λ 是率参数，表示单位时间内事件发生的平均次数。

分布函数（CDF）：

正态分布
正态分布，又称为高斯分布（Gaussian Distribution），是一种连续概率分布，是统计学中最重要的一种概率分布。许多自然和社会现象的分布都近似于正态分布。记作：

概率密度函数（PDF）：

其中： x 是随机变量。 μ 是均值。 σ是标准差。 σ^2是方差。

性质

y=f(x)以x=u为对称轴

x=u时，f(x)取到最大值

y=f(x)以x轴为渐近线，x±σ为拐点

σ固定，u变化，图像左右移动；u固定，σ变小，最高点上移，σ变大，最高点下移。

分布函数（CDF）：

标准正态分布

标准正态分布的均值为0，标准差为1

PDF：

CDF：

性质

y轴是对称轴，为偶函数

概率密度函数：根据偶函数定义可知，

分布函数

正态分布标准化

先中心化将 X 减去均值 μ，得到一个新的随机变量 Y：

标准化：将 Y 除以标准差 σ，得到一个新的随机变量 Z：

标准化正态分布和正态分布的关系

4. 二维随机变量及其分布

定义

二维随机变量是一对随机变量 (X,Y)(X,Y)，其中 XX 和 YY 来自同一个样本空间。

联合分布函数 F(x,y)F(x,y)

几何意义：表示 (x,y)(x,y) 左下方的面积。
性质：
1. 0≤F(x,y)≤10≤F(x,y)≤1
2. 非减性：例如，当 yy 固定，x1<x2x1<x2 时，F(x1,y)≤F(x2,y)F(x1,y)≤F(x2,y)
3. F(−∞,y)=F(x,−∞)=F(−∞,−∞)=0F(−∞,y)=F(x,−∞)=F(−∞,−∞)=0，F(+∞,+∞)=1F(+∞,+∞)=1
4. 关于 xx 和 yy 右连续
边缘分布：
1. X的边缘分布：这表示在所有可能的 Y 值上，X 取值 x 的概率总和。从图形曲线上理解就是求小于x的所有点的面积，Y 随意取值。
2. Y的边缘分布：表示在所有可能的 X 值上，Y 取值 y的概率总和。从图形曲线上理解就是求小于y的所有点的面积，X随意取值。