用迭代法求参数
迭代过程
设有N个数据,对于其中某一个高斯分布,第i次迭代的结果为:
- 由第k个模型生成x点的概率 = (选中第k个模型的概率 * k模型生成这个点的概率密度) / sum所有模型(选中概率*概率密度)[记为gamma(k,x)]
- u_i = 正常计算u的方法中,加入了这个点x为第k个模型生成的概率。
- c_i = 正常计算c的方法中,加入了这个点x为第k个模型生成的概率。
- pi_i = sum所有点(gamma(k,x)) / N
TODO 这个公式怎么出来的?是单个高斯分布的极大似然估计?不过看起来挺有道理的……
初值
- 随机所有初值(真的可以么……)
- 用K-mean计算的结果,作为u的初值。(其他值不知道怎么来的)
然后咔咔算?……