看了一篇来自zouxy09的“从最大似然到EM算法浅解”博文
详细算法和数学公式在 http://blog.csdn.net/zouxy09
本文主要想实现上述文中的例子:例子简要描述。
某学校抽样100位男生和100位女生的身高,男生和女生身高分别满足各自的高斯分布。现在200个样本数据混乱放置在一起,如何通过EM算法,求出男生身高的均值和标准差?
首先,我们模拟男女生身高样本。模拟男生theta值为mu=1.75, sd=0.316。女生theta值为mu=1.65, sd=0.316
按照EM算法步骤,E-Step. 对hidden vairiable (z)进行估计,把男生和女生分成两类。
详细算法和数学公式在 http://blog.csdn.net/zouxy09
本文主要想实现上述文中的例子:例子简要描述。
某学校抽样100位男生和100位女生的身高,男生和女生身高分别满足各自的高斯分布。现在200个样本数据混乱放置在一起,如何通过EM算法,求出男生身高的均值和标准差?
首先,我们模拟男女生身高样本。模拟男生theta值为mu=1.75, sd=0.316。女生theta值为mu=1.65, sd=0.316
#Data simulation
set.seed(1001)
mStudent<-rnorm(100,1.75,0.316)
fStudent<-rnorm(100,1.65,0.316)
totalStu<-cbind(mStudent,fStudent)
totalStu1<-c(mStudent,fStudent)
按照EM算法步骤,E-Step. 对hidden vairiable (z)进行估计,把男生和女生分成两类。
###################
#E-step:
###################
eStep.fn=function(data,flag, muB,sigmaB,muG,sigmaG){
listB = c()
listG = c()
numB=0
numG=0
for