高斯混合模型的matlab实现

最新推荐文章于 2024-04-24 10:37:06 发布

AIHGF

最新推荐文章于 2024-04-24 10:37:06 发布

阅读量4.9k

点赞数 1

分类专栏：聚类分析

聚类分析专栏收录该内容

23 篇文章 3 订阅

订阅专栏

原文地址：http://www.crescentmoon.info/?p=463

高斯混合函数实现部分是基本上是转载的的pluskid大神文章里的里的代码，加了一点注释，并根据他给的方法二解决 covariance 矩阵 singular 的问题。

 
        function 
         varargout = gmm(X, K_or_centroids) 
       
        % ============================================================ 
       
        %转载自http://blog.pluskid.org/?p=39 
       
        % Expectation-Maximization iteration implementation of 
       
        % Gaussian Mixture Model. 
       
        % 
       
        % PX = GMM(X, K_OR_CENTROIDS) 
       
        % [PX MODEL] = GMM(X, K_OR_CENTROIDS) 
       
        % 
       
        %  - X: N-by-D data matrix.%需要注意的是这里的X包括了全部 
       
        %  - K_OR_CENTROIDS: either K indicating the number of 
       
        %       components or a K-by-D matrix indicating the 
       
        %       choosing of the initial K centroids. 
       
        % 
       
        %  - PX: N-by-K matrix indicating the probability of each 
       
        %       component generating each point. 
       
        %  - MODEL: a structure containing the parameters for a GMM: 
       
        %       MODEL.Miu: a K-by-D matrix. 
       
        %       MODEL.Sigma: a D-by-D-by-K matrix. 
       
        %       MODEL.Pi: a 1-by-K vector. 
       
        % ============================================================ 
       
        threshold = 1e-15; 
       
        [N, D] = size(X); 
       
        if 
         isscalar(K_or_centroids) 
       
        K = K_or_centroids; 
       
        % randomly pick centroids 
       
        rndp = randperm(N); 
       
        centroids = X(rndp(1:K),:); 
       
        else 
       
        K = size(K_or_centroids, 1); 
       
        centroids = K_or_centroids; 
       
        end 
       
        % initial values 
       
        [pMiu pPi pSigma] = init_params(); 
       
        Lprev = -inf; 
       
        while 
         true 
       
        Px = calc_prob(); 
        %计算N(x|mu,sigma) 
       
        % new value for pGamma 
       
        pGamma = Px .* repmat(pPi, N, 1); 
        %估计 gamma 是个N*K的矩阵 
       
        pGamma = pGamma ./ repmat(sum(pGamma, 2), 1, K); 
        %对矩阵的理解真是出神入化, 
       
        % new value for parameters of each Component 
       
        Nk = sum(pGamma, 1); 
        %N_K 
       
        pMiu = diag(1./Nk) * pGamma' * X;  
        % 数字 *( K-by-N * N-by-D)加个括号有助理解 
       
        pPi = Nk/N; 
       
        for 
         kk = 1:K 
       
        Xshift = X-repmat(pMiu(kk, : ), N, 1); 
        %x-u 
       
        pSigma(:, :, kk) = (Xshift' * ... 
       
        (diag(pGamma(:, kk)) * Xshift)) / Nk(kk); 
        %更新sigma 
       
        end 
       
        % check for convergence 
       
        L = sum(log(Px*pPi')); 
       
        if 
         L-Lprev < threshold 
       
        break 
        ; 
       
        end 
       
        Lprev = L; 
       
        end 
       
        if 
         nargout == 1 
       
        varargout = {Px}; 
       
        else 
       
        model = []; 
       
        model.Miu = pMiu; 
       
        model.Sigma = pSigma; 
       
        model.Pi = pPi; 
       
        varargout = {pGamma, model}; 
        %注意！！！！！这里和大神代码不同，他返回的是px，而我是 pGamma 
       
        end 
       
        function 
         [pMiu pPi pSigma] = init_params() 
        %初始化参数 
       
        pMiu = centroids; 
        % K-by-D matrix 
       
        pPi = zeros(1, K); 
        %1-by-K matrix 
       
        pSigma = zeros(D, D, K); 
        % 
       
        % hard assign x to each centroids 
       
        distmat = repmat(sum(X.*X, 2), 1, K) + ...  
        % X is a N-by-D data matrix. 
       
        repmat(sum(pMiu.*pMiu, 2)', N, 1) - ... 
        % X->K列 U->N行 XU^T is N-by-K 
       
        2*X*pMiu'; 
        %计算每个点到K个中心的距离 
       
        [~, labels] = min(distmat, [], 2); 
        %找到离X最近的pMiu，[C,I] labels代表这个最小值是从那列选出来的 
       
        for 
         k=1:K 
       
        Xk = X(labels == k, : ); 
        % Xk是所有被归到K类的X向量构成的矩阵 
       
        pPi(k) = size(Xk, 1)/N; 
        % 数一数几个归到K类的 
       
        pSigma(:, :, k) = cov(Xk);  
        %计算协方差矩阵，D-by-D matrix,最小方差无偏估计 
       
        end 
       
        end 
       
        function 
         Px = calc_prob() 
       
        Px = zeros(N, K); 
       
        for 
         k = 1:K 
       
        Xshift = X-repmat(pMiu(k, : ), N, 1); 
        %x-u 
       
        lemda=1e-5; 
       
        conv=pSigma(:, :, k)+lemda*diag(diag(ones(D))); 
        %这里处理singular问题，为协方差矩阵加上一个很小lemda*I 
       
        inv_pSigma = inv(conv); 
        %协方差的逆 
       
        tmp = sum((Xshift*inv_pSigma) .* Xshift, 2); 
        %(X-U_k)sigma.*(X-U_k),tmp是个N*1的向量 
       
        coef = (2*pi)^(-D/2) * sqrt(det(inv_pSigma)); 
        %前面的参数 
       
        Px(:, k) = coef * exp(-0.5*tmp); 
        %把数据点 x 带入到 Gaussian model 里得到的值 
       
        end 
       
        end 
       
        end 
       
        %repmat 通过拓展向量到矩阵 
       
        %inv 求逆 
       
        %min 求矩阵最小值，可以返回标签 
       
        %X(labels == k, : ) 对行做筛选 
       
        % size(Xk, 1) 求矩阵的长或宽 
       
        %scatter 对二维向量绘图

注意：

pluskid大神这里最后返回的是px，我觉得非常奇怪，因为PRML里对点做hard assignment时是根据后验概率来判别的。于是我在大神博客上问了一下，他的解释是最大似然和最大后验的区别，前者是挑x被各个模型产生的概率最大的那个，而后者加上了先验知识，各有道理。一句话就茅塞顿开，真大神也~

然后调用该函数对数据进行聚类，要是数据是二维的或三维的，顺便画个图。

 
        X=[... 
       
        1 1 1.1; 
       
        1 2 1; 
       
        2 1 1; 
       
        2 2 1; 
       
        5 5 2; 
       
        5 6 2; 
       
        6 5 2; 
       
        6 6 2.1] 
        %数据X自己改 
       
        K=2 
       
        %以上设置数据点 
       
        [Px,model]=gmm(X,K); 
        %这里得到结果 
       
        [~,belong]=max(Px,[],2) 
        %选概率最大的那个数，输出聚类结果 
       
        %以下绘图 
       
        z=zeros(size(X,1),3); 
       
        if 
         isscalar(K) 
        %获得类别个数 
       
        K_number=K; 
       
        else 
       
        K_number = size(K, 1); 
       
        end 
       
        for 
         k=1:K_number 
       
        color=[rand rand rand]; 
        %建立颜色矩阵，随机给个颜色 
       
        csize=size(z(belong==k,:),1); 
        %数一数有几行 
       
        z(belong==k,:)=repmat(color,csize,1); 
        %对属于某一类下的点染色 
       
        end 
       
        if 
         size(X,2)==2  
        %二维或三维的可以画一画 
       
        figure( 
        'color' 
        , 
        'w' 
        ); 
        %把背景改成白的 
       
        scatter(X(:,1),X(:,2),30,z) 
       
        axis off; 
        %关掉坐标系显示 
       
        else 
       
        if 
         size(X,2)==3  
        %3维的情况 
       
        figure( 
        'color' 
        , 
        'w' 
        ); 
        %把背景改成白的 
       
        scatter3(X(:,1),X(:,2),X(:,3),30,z, 
        'filled' 
        ) 
       
        end 
       
        end

下面是对鸢尾花数据集聚类的结果。选了部分维度画图
二维图：

三维图：

AIHGF

关注

1
点赞
踩
15

收藏

觉得还不错? 一键收藏
1
评论
高斯混合模型的matlab实现

原文地址：http://www.crescentmoon.info/?p=463高斯混合函数实现部分是基本上是转载的的pluskid大神文章里的里的代码，加了一点注释，并根据他给的方法二解决 covariance 矩阵 singular 的问题。1234567891011
复制链接

扫一扫