在查找答案的过程我发现了很多半懂不懂误导人的讲解,愤慨之。所以自己写一版基础概念辨析。其中所用定义来自百度百科。
1.概率密度函数与概率分布函数
概率密度函数
在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。当概率密度函数存在的时候,累积分布函数是概率密度函数的积分。概率密度函数一般以小写标记。
看完上面的解释可以明确。首先概率密度函数是针对连续型随机变量的,只有连续型随机变量才有概率密度函数,且并不是所有的连续型随机变量都有概率密度函数。
接着看一下定义:对于一维实随机变量X,设它的累积分布函数是,如果存在可测函数满足:
,那么X是一个连续型随机变量,并且是它的概率密度函数。
我们可以发现,概率密度函数是由概率分布函数(累积分布函数)定义的,其含义为,某随机变量的输出值在x点附近的概率。
概率分布函数
概率分布函数是概率论的基本概念之一。在实际问题中,常常要研究一个随机变量ξ取值小于某一数值x的概率,这概率是x的函数,称这种函数为随机变量ξ的分布函数,简称分布函数,记作F(x),即F(x)=P(ξ<x) (-∞<x<+∞),由它并可以决定随机变量落入任何范围内的概率。 例如在桥梁和水坝的设计中,每年河流的最高水位ξ小于x米的概率是x的函数,这个函数就是最高水位ξ的分布函数。实际应用中常用的分布函数有正态分布函数、普阿松分布函数、二项分布函数等等。
2.离散型随机变量与连续型随机变量
离散型随机变量
如果随机变量X只可能取有限个或至多可列个值,则称X为离散型随机变量。
容易混淆的点来了,因为离散型随机变量的概率描述叫做概率分布,简称分布,因为名字很相像所以经常和连续型随机变量的累积分布函数搞混。注意,离散型随机变量x的概率分布,简称分布,并没有函数两字。
这里给出分布的定义:
连续型随机变量
连续型随机变量是指如果随机变量X的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任一点的随机变量。
这里给出定义: