<机器学习练习>K-means聚类算法

最新推荐文章于 2024-08-14 00:10:28 发布

i春暖花开

最新推荐文章于 2024-08-14 00:10:28 发布

阅读量3.2k

点赞数

分类专栏：机器学习文章标签：机器学习算法

本文链接：https://blog.csdn.net/lanyanchenxi/article/details/51494808

版权

本文介绍了K-means聚类算法的基本思想、存在的缺点及算法流程。通过编程练习，展示了在选择不同聚类数量（3和10）时的结果，指出在某些情况下质心可能出现不确定性，同时说明程序未进行优化处理。

摘要由CSDN通过智能技术生成

1：思想

  K-means，属于无监督学习。即输入数据没有标签y，经过一些算法后，找到标签y。
  聚类的目的就是找到每个样本潜在的标签y，并将同类别的样本放到一起。
  而k-means聚类：就是把n个点（可以是样本的一次观察或一个实例）划分到k个聚类中，
  使得每个点都属于离他最近的均值（此即聚类中心）对应的聚类，以之作为聚类的标准。

2：缺点

  1)聚类数量k，需要输入。选择不恰当，聚类结果很糟糕。
  2)收敛到局部最优解，和直观想象不一样，这种可以多此选择初始点，进行多次实验，取平均来克服。

3:算法

这里写图片描述

4：练习程序

clear all;
clc ;
%第一类数据
mu1=[0,0,0];                  %%多维高斯向量均值
s1=[0.3 0 0;0 0.35 0;0 0 0.3];%%协方差分布
data1=mvnrnd(mu1,s1,100);     %%产生高斯分布数据

%第二类数据
mu2=[1.25,1.25,1.25];   %%多维高斯向量均值
s2=[0.3 0 0;0 0.35 0;0 0 0.3];%%协方差分布
data2=mvnrnd(mu2,s2,100);