2概 率 分 布
试验得到的数据通常呈现一定的规律性,引入随机变量以后,可以将随机数据表达为随机变量的函数。常见的随机变量有离散型随机变量和连续型随机变量两种。
● 当变量全部可以取到的值是有限个或可列无限多个时,称为离散型随机变量。
● 如果对于随机变量x的分布函数F(x),存在非负函数f(x),使得对于任意实数x有
(1)
则称X为连续型随机变量。
对应于离散型随机变量和连续型随机变量,有离散型概率分布函数和连续型概率分布函数。
2.1概率密度函数
2.1.1基本数学原理
对于离散型概率分布和连续型概率分布,二者的概率密度函数定义有所不同。上面(1)式中,函数f(x)称为X的概率密度函数。该函数具有以下性质:
●
●
●
● 若f(x)在点x处连续,则有。
对于离散型概率分布,则不称其为概率密度函数,而叫做概率分布或分布律。设离散型随机变量x所有可能取的值为xk(k=1,2,…),x取各个可能值的概率,即事件{X=xk}的概率为:
P{X=xk}=pk, k=1,2,…
pk即称为分布律。它有下面两个性质:
●
●
2.1.2相关函数介绍
对于连续型概率分布函数,表2给出了对应函数的概率密度函数及其数学意义和调用格式。下面选择正态分布概率密度函数和指数分布概率密度函数进行重点介绍。
normpdf函数
功能:计算正态概率密度函数。
语法:Y = normpdf(X,MU,SIGMA)
描述:normpdf(X,MU,SIGMA) 计算参数为MU和SIGMA的数据X的正态概率密度函数。参数SIGMA必须为正。
正态概率密度函数的计算公式为:
似然函数为概率密度函数,它被视为参数的函数。最大似然估计量(MLEs)是使x处的似然函数最小化时的值。
若x服从标准正态分布,则x + µ 也服从均值为µ,标准差为σ的正态分布。相反地,若y服从参数为µ和σ的正态分布,则x = (y -µ)/σ服从标准正态分布。
举例:
mu = [0:0.1:2];
[y i] = max(normpdf(1.5,mu,1));
MLE = mu(i)
MLE =
1.5000
exppdf函数
功能:计算指数概率密度函数。
语法:Y = exppdf(X,MU)
描述:exppdf(X,MU) 计算X处的参数为MU的指数概率密度函数。MU参数必须为正。
指数概率密度函数为:
指数概率密度函数等价于第一个参数(a)等于1时的伽玛概率密度函数。
举例:
y = exppdf(5,1:5)
y =
0.0067 0.0410 0.0630 0.0716 0.0736
y = exppdf(1:5,1:5)
y =
0.3679 0.1839 0.1226 0.0920 0.0736
表2 常见分布的概率密度函数名对应的分布数 学 意 义调 用 格 式
betapdf贝塔分布()Y = betapdf(X,A,B)
binopdf二项分布Y=binopdf(X,N,P)
chi2pdf卡方分布Y=chi2pdf(X,V)
exppdf指数分布Y=exppdf(X,MU)
fpdfF分布Y=fpdf(X,V1,V2)
gampdf伽玛分布Y=gampdf(X,A,B)
geopdf几何分布其中,Y=geopdf(X,P)
hygepdf超几何分布Y=hygepdf(X,M,K,N)
normpdf正态(高斯)分布Y=normpdf(X,MU,SIGMA)
lognpdf对数正态分布Y=lognpdf(X,MU,SIGMA)
nbinpdf负二项分布其中,Y=nbinpdf(X,R,P)
ncfpdf非中心F分布假设随机变量服从自由度为、非中心参数为的非中心卡方分布,服从自由度为的卡方分布,且和相互独立,则随机变量的分布称为自由度为(,)、非中心参数为的非中心F分布。Y=ncfpdf(X,NU1,NU2,DELTA)
nctpdf非中心t分布如果U服从参数为和1的正态分布,服从自由度为v的分布,并且U与相互独立,则称随机变量的分布为自由度为v、非中心参数为的非中心t分布。Y=nctpdf(X,V,DELTA)
ncx2pdf非中心卡方分布如果随机变量Xi服从参数为(i=1,…,v)和的正态分布,并且相互独立,则随机变量所服从的分布称为自由度为v、非中心参数为的非中心分布。Y=ncx2pdf(X,V,DELTA)
poisspdf泊松分布Y=poisspdf(X,LAMBDA)
raylpdf雷利分布Y=raylpdf(X,B)
tpdf学生氏t分布Y=tpdf(X,V)
unidpdf离散均匀分布Y=unidpdf(X,N)
unifpdf连续均匀分布Y=unifpdf(X,A,B)
weibpdf威布尔分布Y=weibpdf(X,A,B)
2.2累加分布函数
2.2.1基本数学原理
对于连续型随机变量,其分布函数的定义为:若X为随机变量,x为任意实数,则函数
称为X的分布函数。如果知道X的分布函数,就知道了X落在任一区间(x1,x2]上的概率。
分布函数F(x)具有以下一些性质:
● F(x)是不减函数;
● 且
● ,即F(x)是右连续的。
2.2.2相关函数介绍
normcdf函数
功能:计算累加正态分布函数。
语法:P = normcdf(X,MU,SIGMA)
描述:normcdf(X,MU,SIGMA) 计算服从参数为MU和SIGMA的正态分布数据X的累加分布函数。参数SIGMA必须为正。
累加正态分布函数为:
结果p为取自参数为µ和的正态分布的单个观测量落在区间(-x]中的概率。
举例:
下面的例子求取自标准正态分布的一个观测量落在区间[-1 1]中的概率。
p = normcdf([-1 1]);
p(2) - p(1)
ans =
0.6827
更一般地,若观测量取自参数为和µ的正态分布,则它落在该区间中的概率为68%。
expcdf函数
功能:计算累加指数分布函数。
语法:P = expcdf(X,MU)
描述:expcdf(X,MU) 计算参数为MU的数据X的累加指数分布函数。指数MU必须为正。
累加指数分布函数的计算公式为:
结果p为源于指数分布的单个观测量落在区间[0 x]中的概率。
举例:
指数为µ的指数分布数据的中值等于µ*log(2),下例进行演示。
mu = 10:10:60;
p = expcdf(log(2)*mu,mu)
p =
0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
下面计算指数分布随机变量小于或等于均值µ的概率。
mu = 1:6;
x = mu;
p = expcdf(x,mu)
p =
0.6321 0.6321 0.6321 0.6321 0.6321 0.6321