连续概率分布即连续型随机变量的概率分布,是概率论中的主要研究内容。下面介绍几种常见的单变量连续概率分布及Python运用
一、均匀分布
连续型均匀分布是指在支撑内各个点的概率密度均相等的分布
符号:
概率密度函数:
期望:
方差:
二、正态分布
正态分布是样本均值分布在样本量趋于无穷时的分布
符号:
概率密度函数:
期望:
加号左边的被积函数关于 对称,因此为0。加号右边的被积函数即概率密度函数,积分为 1
方差:直接求正态分布的方差有些麻烦,下面先求标准正态分布 N(0, 1) 的方差
,分部积分得
,作极坐标变换得
对于正态分布 ,,因此
性质:线性变换:设 的标准正态分布,则
不相关可以推导出独立:,,X 与 Y 不相关,则 X 与 Y 独立
三、伽玛分布
伽玛分布是一个神奇的分布,跟各种分布都有千丝万缕的联系,指数分布与卡方分布都是特殊的伽玛分布
符号:
在介绍伽玛分布的概率密度函数前要先介绍伽玛函数:
对伽玛函数分部积分可得递推公式:,又
所以当 为整数时,
概率密度函数:对伽玛函数等式两边进行变形得到:
设 ,有 ,被积函数即伽玛分布的概率密度函数
期望:
方差:
技巧是揍 与 的概率密度函数,再用伽玛函数的性质
性质:可加性:若 且 X 与 Y 独立,则
四、指数分布
指数分布是支撑为非负数且满足无记忆性的分布。所谓无记忆性,指
指数分布 即
符号:
概率密度函数:由无记忆性条件得:,用积累分布函数表示为
,对 a 求偏导得
,对 b 求偏导得
,不妨取 b=0 有
,记 f(0) 为 ,解微分方程得
,C 为常数
又 f(a) 为概率密度函数,其在支撑上的积分为 1,解得 C=,因此指数分布的概率密度函数为
期望:
方差:
性质:无记忆性:
五、卡方分布
卡方分布是 n 个独立同分布的标准正态分布平方和的分布
即
符号:
概率密度函数: 代入即可
期望:
方差:
性质:可加性:若 且 X 与 Y 独立,则
以上各个分布的性质证明需要用到特征函数,以后再补
六、Python应用
from scipy.stats import uniform, norm, expon, gamma, chi2
###########生成随机数###########
uniform.rvs(loc=1, scale=10, size=100) # 1 到 1 + 10 的均匀分布随机数 100 个
norm.rvs(loc=1, scale=0.3, size=100) # 均值为 1,标准差为 0.3 的正态分布随机数 100 个
expon.rvs(scale=0.5, size=10) # lambda 为 2 的指数分布随机数 10 个
gamma.rvs(a=0.4, scale=0.5,size=100) # alpha = 0.4, lambda=2 的伽玛分布随机数 100 个
chi2.rvs(k=100, size=10) # n=100 的卡方分布随机数 10 个
###########计算概率###########
uniform.pdf(x=2, loc=1, scale=10, size=100) # 1 到 1 + 10 的均匀分布在 x=2 处的概率密度
norm.pdf(x=2, loc=1, scale=0.3, size=100) # 均值为 1,标准差为 0.3 的正态分布在 x=2 处的概率密度
expon.pdf(x=2, scale=0.5 size=10) # lambda 为 2 的指数分布在 x=2 处的概率密度
gamma.pdf(x=2, scale=0.5, a=0.4, size=100) # alpha = 0.4, lambda=2 的伽玛分布在 x=2 处的概率密度
chi2.pdf(x=2, k=100, size=10) # n=100 的卡方分布在 x=2 处的概率密度
###########累积分布函数###########
uniform.cdf(x=2, loc=1, scale=10, size=100) # 1 到 1 + 10 的均匀分布小于等于 2 的概率
norm.cdf(x=2, loc=1, scale=0.3, size=100) # 均值为 1,标准差为 0.3 的正态分布小于等于 2 的概率
expon.cdf(x=2, scale=0.5, size=10) # lambda 为 2 的指数分布小于等于 2 的概率
gamma.cdf(x=2, scale=0.5, a=0.4, size=100) # alpha = 0.4, lambda=2 的伽玛分布小于等于 2 的概率
chi2.cdf(x=2, k=100, size=10) # n=100 的卡方分布小于等于 2 的概率
注意到,在 Python 中伽玛分布与指数分布的参数 是通过指定 的倒数 scale 实现的