K-Means聚类
聚类算法概念:
聚类分析又称群分析,它是研究分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类分析是由若干模式组成的,通常,模式是一个度量的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
通俗意义上,就是把一个未知分类的数据集合,根据我们的需求根据特征对其进行分类,方便我们进行批量处理和发现数据集合单元之间的相关性。
一个具有注脚的文本。1
K-Means算法的基本流程:
距离计算方法介绍
闵可夫斯基距离
d i s t ( X , Y ) = ∑ ∣ x i − y i ∣ p p dist(X,Y) = \sqrt[p]{\sum|x_i-y_i|^p} dist(X,Y)=p∑∣xi−yi∣p