K聚类用法
- 对未知分类的数据进行分类。
- 分类之前要人为定义要分多少类,即要先确定 K 值
- 分类后可以得出每一个样本属于哪一个类,以及各类的中心点。
MATLAB函数
-
[idx,C,sumd,D] = kmeans(X,K)
- 输入 X 是要分类的数据矩阵,每一行是一个样本,每一列是一组特征值。输入 K 是规定的分类组数。
- idx 是一个列向量,记录对应位置处样本所属类的序号。
- C 记录了 K 个类的中心点的坐标。
- sumd 记录了每组的中心点,每一行是一个中心点坐标。
- D 记录了每个点到每个中心点的距离的平方,第 i 行的第 j 列为第 i 个样本到第 j 组中心点的距离平方。
实例
- 对下面这组数据进行分类,规定分为 2 类
clear
X = [0 0;1 0;