1 极大似然估计
1.1 极大似然估计基本概念
对于极大似然函数的理解,可以从一个最简单的例子开始。一位老猎人和一位打猎新手一起外出打猎,一只野兔从眼前窜过,只听得一声枪响,兔子应声而倒。现在请问兔子是被谁打中的?大多数人的答案会是老猎人,因为老猎人最有可能打中兔子。
这种猜测背后所体现的原理就是极大似然估计。极大似然估计的数学原理表述为:
假设一组样本
S=(X1,X2,...,Xn)
是由参数
θ
确定的概率分布模型
P(x:θ)
独立的生成的。对于参数
θ
的最大似然估计被定义为:
θml=argθmaxPmodel(S;θ)=argθmax∏i=0nPmodel(x(i);θ)
为了便于计算,我们常常采用似然函数的对数形式:
θml=argθmax∑i=1mlogPmodel(X(i);θ)
总之,极大似然估计就是要找到能够是的目前所有样本出现概率最大的参数
θ
的估计值。
1.2 条件对数似然
最大似然估计扩展到估计条件概率 P(y|X;θ) 从而给定 X 预测
θml=argθmax∑i=1nlogP(y(i)|x(i);θ)
1.3 极大似然函数推到线性回归:
我们希望学习到一个条件概率分布: P(y|x) ,而不是一个单独的预测 ŷ 。现在学习目标是拟合条件概率分布 P(y|x) 。我们定义 P(y|x)=