【机器学习】EM算法实现

最新推荐文章于 2020-12-10 09:36:06 发布

phdsky

最新推荐文章于 2020-12-10 09:36:06 发布

阅读量560

点赞数 1

分类专栏：人工智能文章标签： EM算法高斯混合模型 GMM E步 M步

本文链接：https://blog.csdn.net/phdsky/article/details/103175156

版权

人工智能专栏收录该内容

13 篇文章 0 订阅

订阅专栏

文章目录

数据准备
EM算法
高斯混合模型参数估计
总结
参考

数据准备

本文实现的是利用EM算法学习高斯混合模型，为了简化过程采用对离散点进行聚类判定，离散点通过sklearn生成。

EM算法

EM算法的推导证明和收敛分析暂时留坑。

EM算法中对隐变量和观测变量的交替估计，给我的第一感觉是有点像SLAM里对landmark和pose的联合优化。

高斯混合模型参数估计

高斯混合模型的算法流程如下：
GMM-EM
实现代码如下：

# @Author: phd
# @Date: 2019/11/11
# @Site: github.com/phdsky
# @Description: NULL

import time
import logging

import numpy as np
from scipy.stats import multivariate_normal

from matplotlib import pyplot as plt
from sklearn.datasets.samples_generator import make_blobs


class GMM(object):gmm
    def __init__(self, K, X, init_method):
        self.K = K
        self.Y = X
        self.N, self.D = X.shape  # data shape

        self.init = init_method
        if self.init == 'random':
            self.mean = np.random.rand(self.K, self.D)
            self.cov = np.asarray([np.eye(self.D)] * K)
            self.alpha = np.asarray([1. / self.K] * self.K)

        elif self.init == 'kmeans':
            print("Not implemented yet...")
        else:
            print("WTF the init type is?")

    def calc_phi(self, Y, mean, cov):
        return multivariate_normal.pdf(x=Y, mean=mean, cov=cov)

    def E_step(self):
        gamma = np.zeros((self.N, self.K))

        for k in range(self.K):
            gamma[:, k] =  self.calc_phi(self.Y, self.mean[k], self.cov[k])

        for k in range(self.K):
            gamma[:, k] *= self.alpha[k]

        for n in range(self.N):
            gamma[n, :] /= np.sum(gamma[n, :])

        return gamma

    def M_step(self, gamma):
        # cov computation use old mean value
        # so, update cov first
        for k in range(self.K):
            gamma_k = np.reshape(gamma[:, k], (self.N, 1))
            gamma_k_sum = np.sum(gamma_k)

            # cov
            y_mean = self.Y - self.mean[k]
            self.cov[k] = y_mean.T.dot(np.multiply(y_mean, gamma_k)) / gamma_k_sum

            # mean
            self.mean[k] = np.sum(np.multiply(gamma_k, self.Y), axis=0) / gamma_k_sum

            # alpha
            self.alpha[k] = gamma_k_sum / self.N

    def train(self, max_iteration):
        for i in range(max_iteration):
            print("Iteration: %d" % i)

            # Take E Step
            gamma = self.E_step()

            # Take M Step
            self.M_step(gamma=gamma)

    def predict(self):
        gamma = self.E_step()

        colors = ['b', 'g', 'r', 'c', 'm', 'y', 'k', 'w']
        predictions = np.argmax(gamma, axis=1)
        for k in range(self.K):

            # plot mean point
            plt.scatter(self.mean[k][0], self.mean[k][1], c='black', edgecolors='none', marker='D')

            # plot points
            pred_ids = np.where(predictions == k)
            plt.scatter(self.Y[pred_ids[0], 0], self.Y[pred_ids[0], 1], c=colors[k], alpha=0.4, edgecolors='none', marker='s')

        plt.show()

if __name__ == "__main__":
    logger = logging.getLogger()
    logger.setLevel(logging.DEBUG)

    clusters = 4
    X, y = make_blobs(n_samples=100*clusters, centers=clusters, cluster_std=0.5, random_state=0)
    # plt.scatter(X[:, 0], X[:, 1])
    # plt.show()

    # Available init method: random / kmeans
    gmm = GMM(K=clusters, X=X, init_method='random')

    gmm.train(max_iteration=200)

    gmm.predict()

输出分类结果如下图：
gmm-cluster

总结

EM算法重点在于定义求极大似然期望的Q函数，E步通过给定的观测变量和当前的函数参数估计求隐变量的概率分布；M步通过Q函数求极大化对各个参数进行求导，得到参数变量的新估计值。

参考

《统计学习方法》

phdsky

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
【机器学习】EM算法实现

数据准备本文实现的是利用EM算法学习高斯混合模型，为了简化过程采用对离散点进行聚类判定，离散点通过sklearn生成。EM算法EM算法的推导证明和收敛分析暂时留坑。EM算法中对隐变量和观测变量的交替估计，给我的第一感觉是有点像SLAM里对landmark和pose的联合优化。
复制链接

扫一扫