聚类分析
将数据根据相似度分成几类,比如1.1,1.2,2.1,2.2可以分为两类,1.1,1.2是一类2.1,2.2是一类
K均值
聚类分析算法的一种,步骤如下
- 从n条记录中先设置k个分类,然后随便选k条记录,比如直接选前k个,得到k个类别。
- 将剩余的(n-k)条记录与选取的k条记录分别求欧氏距离,得出的是(n-k)乘k矩阵,将(n-k)条记录都归入k条聚类中心中与其欧式距离最近的集合中。
- 现在得到k个2维矩阵,求每个矩阵的方差,如果相加后小于设定值,则说明收敛,算法结束,否则使用这k个2维矩阵,每个矩阵的均值重新作为第一步中的k个分类,然后递归算法。