参数估计不同于估计。
日常所说的估计一般是通过样本分布估计总体的分布,如用样本集的均值作为总体的期望。
参数估计也不同于非参数估计。
在参数估计中,模型是假设已知的,估计得参数后就可得完整模型;而非参数估计中是未知的。在以下参数估计的讨论中,皆假设模型是已知的,参数是未知的。
而对于参数估计,我们希望通过某些方法,通过给定样本集 D D 估计假定模型的参数。极大似然估计就可以帮我们从参数空间中选择参数,使该参数下的模型产生 D D 的概率最大(最似然的)。
- 对于判别模型,就对于 y=f(x|θ) y = f ( x | θ ) ,假定 f f (如假设为线性回归),通过 和 y y 估计 。
- 对于生成模型,就对于 pdata(x;θ)→D p d a t a ( x ; θ ) → D ,假定 p p (如假设为正态分布),通过 估计 θ θ 。
生成模型下的极大似然估计
考虑一组含有m个样本的数据集 X={ x(1),...,x(m)} X = { x ( 1 ) , . . . , x ( m ) } ,由 pdata(x) p d a t a ( x ) 生成,独立同分布。
既然样本由隐含分布 pdata(x) p d a t a ( x ) 生成,那么该分布就可以通过隐含的参数 θ θ 完整表达。待求模型 pmodel(x;θ) p m o d e l ( x ; θ ) 就是一簇由 θ