K-means聚类算法
1.1 题目的主要研究内容(宋体四号加粗左对齐)
- K-means算法原理推导并分析
- MATLAB自带K-means函数分析
(3)基于MATLAB的算法分析,使用轮廓SC来量化两种方法
1.2 题目研究的工作基础或实验条件
(1)Windows10
(2)MATLAB 2018
1.3 设计思想
K-means算法是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。
K-mean算法步骤如下:
(1)随机选取K个样本为中⼼
(2)分别计算所有样本到随机选取的K个中⼼的距离
(3)样本离哪个中⼼近就被分到哪个中⼼
(4)计算各个中⼼样本的均值(最简单的⽅法就是求样本每个维度的平均值)作为新的中心
(5)重复(2)(3)(4)直到新的中⼼和原来的中⼼基本不变化的
时候,算法结束
1.4 流程图
1.5 主要程序代码
%% 原理推导K均值
[m,n]=size(data);%求出横纵坐标长度
cluster_num=4;%设置聚类数