本文记录kmeans聚类算法学习的相关内容,后续会更新............
概念:kmeans算法是输入聚类个数k,以及包含 n个数据对象的数据库,输出满足方差最小标准k个聚类的一种算法。k-means 算法将n个数据对象划分为 k个聚类:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
kmeans算法的简要步骤:
(1)随机初始化k个点作为聚类质心
(2)计算数据对象到质心的距离,并将数据对象分配到距离最近的一个簇
(3)针对每一个聚类,计算簇中所有点的均值并将其作为新的质心
(4)反复迭代,当数据对象距离最近簇的距离不再变化或满足一定的条件是,停止计算,返回k个聚类的质心