EM算法最佳实现

最新推荐文章于 2020-12-16 05:30:37 发布

nbu04william

最新推荐文章于 2020-12-16 05:30:37 发布

阅读量585

点赞数 1

分类专栏： python 统计学习

本文链接：https://blog.csdn.net/nbu2004/article/details/86426451

版权

python 同时被 2 个专栏收录

23 篇文章 0 订阅

订阅专栏

统计学习

4 篇文章 0 订阅

订阅专栏

参考EM算法
下面给出算法的简化版本。

import numpy as np
import numpy.linalg as LA
 
SIGMA = 6
EPS = 0.0001

#生成方差相同, 均值不同的样本
def generate_data():    
    mu1 = 20
    mu2 = 40
    N = 1000
    X = np.zeros(N)
    for i in range(N):
        temp = np.random.uniform(0, 1) # Z ~ U[0,1]
        if temp > 0.5:
            X[i] = temp*SIGMA + mu1  # X1 = Z * 6 + 20
        else:
            X[i] = temp*SIGMA + mu2  # X2 = Z * 6 + 40
    return X
 

def my_EM(X):
    N = X.shape[0]
    k = 2
    mu = np.random.rand(k)
    Posterior = np.zeros((N, 2))
    #先求后验概率
    for _ in range(1000):
        for i in range(N):
            p = np.exp(-1/(2*SIGMA**2) * (X[i] - mu)**2)
            Posterior[i,:] = p/np.sum(p)
        oldmu = mu.copy()
        #最大化    
        numerator = np.dot(X, Posterior)
        dominator = Posterior.sum(axis=0)
        mu = numerator/dominator
        if LA.norm(mu - oldmu) < EPS:
            return mu
 
if __name__ == '__main__':
    X = generate_data()
    print(my_EM(X))