设 为离散型随机变量, 其全部可能值为
. 则
称为 的概率函数.
设 为一随机变量, 则函数
称为 的分布函数.
设某事件 在一次试验中发生的概率为
. 现在把这试验独立地重复
次.
所遵从的概率分布称为二项分布, 并常记为 .
服从二项分布就记为
.
设连续性随机变量 有概率分布函数
, 则
的导数
, 称为
的概率密度函数.
设连续性随机变量 的密度函数
都具有以下三条基本性质
概率模型(Statistical Model,也称为Probabilistic Model)是用来描述不同随机变量之间关系的数学模型,通常情况下刻画了一个或多个随机变量之间的相互非确定性的概率关系。从数学上讲,该模型通常被表达为,其中
是观测集合用来描述可能的观测结果,
是
对应的概率分布函数集合。若使用概率模型,一般而言需假设存在一个确定的分布
生成观测数据
。因此通常使用统计推断的办法确定集合
中谁是数据产生的原因。
概率模型是一个概率分布函数或密度函数的集合。可分为参数模型,无参数和半参数模型。
参数模型是一组由有限维参数构成的分布集合。其中
是参数,而
是其可行欧几里得子空间。概率模型可被用来描述一组可产生已知采样数据的分布集合。例如,假设数据产生于唯一参数的高斯分布,则我们可假设该概率模型为
。