最大似然估计定义
“模型已知,参数未知”
假设:{}是一个试验的样本空间,且满足概率分布,及对应的概率密度函数为(函数模型中的参数是未知的)。
依据以上假设:重复试验次(独立同分布),观察到样本的次数为,那么,在次试验中的相对频率为:
当越来越大时,相对频率就越来越接近于的概率,即:
因此,通常用相对概率作为概率的估计值,并以此求解概率分布模型中的未知参数。这种估计概率值并以此求解模型参数的方法称为最大似然估计。
通俗理解来说,就是利用已知的样本结果信息,求解最具有可能(最大概率)导致这些样本结果出现的模型参数值!这样便可以认为在该模型参数下,这样的样本结果是最可以数学解释。
概率函数与似然函数
对于函数: 输入有两个:表示某一个具体的数据; 表示模型的参数:
如果是已知确定的,是变量,这个函数叫做概率函数(probability function),它描述对于不同的样本点 ,其出现概率是多少。
如果是已知确定的,是变量,这个函数叫做似然函数(likelihood function), 它描述对于不同的模型参数,出现这个样本点的概率是多少。