1. K-means 聚类算法的基本原理
Kmeans是无监督学习的代表,没有所谓的Y。主要目的是分类,分类的依据就是样本之间的距离。比如要分为K类。步骤是:
- 随机选取K个点。
- 计算每个点到K个质心的距离,分成K个簇。
- 计算K个簇样本的平均值作新的质心
- 循环2、3
- 位置不变,距离完成
2. 关于聚类的距离
Kmeans的基本原理是计算距离。一般有三种距离可选:
曼哈度距离:
欧式距离:
Kmeans是无监督学习的代表,没有所谓的Y。主要目的是分类,分类的依据就是样本之间的距离。比如要分为K类。步骤是:
Kmeans的基本原理是计算距离。一般有三种距离可选:
曼哈度距离:
欧式距离: