【机器学习】EM
EM
何为隐变量?
现已知班级里有50名男生和50名女生,假设男生和女生的身高各服从不同正态分布,要求估计出正态分布的参数,那我们拿到一个身高数据,并且已经知道这个身高数据是属于男生还是女生,我们就可以用所有男生的身高数据和女生的身高数据分别利用极大似然法
求出参数。而现在我们不知道这条数据是属于男生还是女生,那么对于这条数据来说,就存在两个隐变量
,即属于男生还是属于女生。
极大似然估计(MLE)
所谓似然函数,就是将 n n n个样本点一个个代入未知参数的模型,比如不知参数的正态分布函数,然后将它们相乘即可得到似然函数。
L ( μ , σ 2 ) = f ( x 1 ; μ , σ 2 ) f ( x 2 ; μ , σ 2 ) . . . f ( x n ; μ , σ 2 ) = ∏ i n f ( x i ; μ , σ 2 ) L(\mu,\sigma^2)=f(x_1;\mu,\sigma^2)f(x_2;\mu,\sigma^2)...f(x_n;\mu,\sigma^2)=\prod_i^nf(x_i;\mu,\sigma^2) L(μ,σ2)=f(x1;μ,σ2)f(x2;μ,σ2)...f(xn;μ,σ2)=i∏nf(xi;μ,σ2)
最接近真实模型的参数会让上式的值很大,所以我们的目标就是求解:
( μ ∗ , σ ∗ ) = a r g m a x L ( μ , σ ) (\mu^*,\sigma^*)=argmax L(\mu,\sigma) (μ∗,