一 问题:假设有两个班的成绩都服从高斯分布,但不知道属于哪个班。
二 EM算法步骤
1.先做一个合适的假设来确定一部分值,如假设两个班的先验概率相同,且概率分布如下图:
则此时红框里的值就是已知的。
2.接着评估一下每个点属于哪个班级:
比如i这个点分别属于一班和二班的概率可表示为:
3.然后根据概率重新画出分布并重新计算平均值,方差:
4. 最后重复迭代上述步骤。
三 总结:
# 初始化方案会影响EM算法的分类结果。
学习视频:
1.先做一个合适的假设来确定一部分值,如假设两个班的先验概率相同,且概率分布如下图:
则此时红框里的值就是已知的。
2.接着评估一下每个点属于哪个班级:
比如i这个点分别属于一班和二班的概率可表示为:
3.然后根据概率重新画出分布并重新计算平均值,方差:
4. 最后重复迭代上述步骤。
# 初始化方案会影响EM算法的分类结果。
学习视频: