关于k_means算法的初步理解
一、什么是k_means算法。
k_means算法简单理解就是输入聚类值k,然后利用各个数据的均值将其分类成k个聚类。
二、k_means算法的相关名词概念。
- k值:初始质心的个数,即能分为几个簇群。
- 质心:均值,取相应簇群中所有点位置的均值。
- 无监督学习:机器处理未被标记的样本集。k_means算法属于无监督学习的一类。
三、k_means算法的简单实现过程。
- 实现该算法的简单思路:
选质心,更新质心,不断迭代。 - 实现该算法的具体过程:
1.先输入k值
2.读取文件中的各个点坐标
3.随机出k个质心的初始位置,先定义k个空数组
4.计算各个点分别到k个质心的距离,比较求出距离其最短的质心,将其归入这个质心的数组群中
5.在根据数组中各个点的距离均值,重新定义每个簇中的质心
6.不断迭代4,5步,直至质心不再变化,结束迭代
7.完成迭代,输出k个簇的各个点。 - 简单模拟
模拟图:链接: https://www.naftaliharris.com/blog/visualizing-k-means-clustering/.
1.分类较为明显的数据集(每次的分类都能基本固定)