似然函数(Likelihood function)是统计学中用于估计模型参数的一个函数,它是给定一组观察数据时,模型参数的函数,表示这些参数使得观察数据出现的概率。似然函数通常表示为𝐿(𝜃∣𝑥)L(θ∣x),其中𝜃θ是模型参数,𝑥x是观察到的数据。
似然函数的概念与概率密度函数(probability density function, PDF)或概率质量函数(probability mass function, PMF)有关,但它们的角度不同。概率密度函数描述了在给定参数的情况下,数据出现的概率,而似然函数则是在给定数据的情况下,参数的概率。
似然函数的特点:
参数估计:似然函数用于参数估计,特别是最大似然估计(Maximum Likelihood Estimation, MLE)。通过最大化似然函数来找到最佳参数估计值。
非概率解释:似然函数本身不是概率,它不满足概率的归一化条件(即在所有可能参数值上的积分或求和不等于1)。
对称性:似然函数通常是关于参数的对称函数,这意味着它不区分参数的顺序。
数据的函数:似然函数是数据的函数,它反映了给定数据对参数的“喜好”程度。
最大似然估计(MLE):
最大似然估计是一种常用的参数估计方法,其基本思想是选择参数值,使得观察到的数据出现的概率(即似然函数)最大化。具体步骤如下:
写出似然函数 𝐿(𝜃∣𝑥)L(θ∣x)。
通常为了方便计算,取似然函数的对数,得到对数似然函数 ln𝐿(𝜃∣𝑥)lnL(θ∣x)。
求解对数似然函数的最大值,即求解 𝜃θ 的值,使得 ln𝐿(𝜃∣𝑥)lnL(θ∣x) 最大。
例子:
假设我们有一组独立同分布的正态分布数据𝑋1,𝑋2,...,𝑋𝑛X1,X2,...,Xn,其均值为𝜇μ,方差为𝜎2σ2。似然函数为:𝐿(𝜇,𝜎2∣𝑥)=∏𝑖=1𝑛12𝜋𝜎2𝑒−(𝑥𝑖−𝜇)22𝜎2L(μ,σ2∣x)=∏i=1n2πσ21e−2σ2(xi−μ)2对数似然函数为:ln𝐿(𝜇,𝜎2∣𝑥)=−𝑛2ln(2𝜋)−𝑛ln(𝜎)−12𝜎2∑𝑖=1𝑛(𝑥𝑖−𝜇)2lnL(μ,σ2∣x)=−2nln(2π)−nln(σ)−2σ21∑i=1n(xi−μ)2通过求解𝜇μ和𝜎2σ2的值,使得ln𝐿(𝜇,𝜎2∣𝑥)lnL(μ,σ2∣x)最大,我们可以得到𝜇μ和𝜎2σ2的最大似然估计值。在正态分布的情况下,𝜇μ的MLE是样本均值,𝜎2σ2的MLE是样本方差。