K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一
算法原理
随机选取k个中心点;
遍历所有数据,将每个数据划分到最近的中心点中;
计算每个聚类的平均值,并作为新的中心点;
重复2-3,直到这k个中线点不再变化(收敛了)。
时间复杂度:O(I*n*k*m)
空间复杂度:O(n*m)
其中m为每个元素字段个数,n为数据量,I为跌打个数。一般I,k,m均可认为是常量,
所以时间和空间复杂度可以简化为:O(n),即线性的。
K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一
算法原理
随机选取k个中心点;
遍历所有数据,将每个数据划分到最近的中心点中;
计算每个聚类的平均值,并作为新的中心点;
重复2-3,直到这k个中线点不再变化(收敛了)。
时间复杂度:O(I*n*k*m)
空间复杂度:O(n*m)
其中m为每个元素字段个数,n为数据量,I为跌打个数。一般I,k,m均可认为是常量,
所以时间和空间复杂度可以简化为:O(n),即线性的。