一、K-means聚类算法基本知识
csdn
https://blog.csdn.net/llh_1178/article/details/81633396blog.csdn.net https://blog.csdn.net/qq_32892383/article/details/80107795blog.csdn.net https://blog.csdn.net/dashenghuahua/article/details/53160546blog.csdn.net二、个人学习心得
K-means聚类算法,刚学的时候差点跟k-nn搞混了,不过两者的k含义有很大的不同,K-means的k是作为类别个数来设置的,而knn中的k则是为了判断一个数据点属于哪个类别在其周围需要找k个点的意思,此外两者的差别还在于knn为有监督学习而kmeans为无监督学习。两者的相似之处在于都是基于欧氏距离来判断数据点所属的类别。
k-means,k指类别个数,means平均的意思,类别和平均,这两个词基本上阐述了k-means聚类算法的中心思想,用一种取平均值的方法来把数据点分为k类,取平均值的方法指的是通过计算同一类数据点的中心,不断地寻找i数据点中心,直到所有的数据点都很好的被分到相应的类别中,这里我用很好这个词来形容,实际上在真正处理的过程中是有一定的判别准则的,太复杂的不谈,嘻嘻,就写到这里吧。
- K-means聚类算法是什么?
K-Means算法是典型的基于距离的非层次聚类算法,在最小化误差函数的基础上将数据划分为预定的类数K,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。
2. k-means算法基本步骤
(1)从数据中选择k个对象作为初始聚类中心;
(2)计算每个聚类对象到聚类中心的距离来划分;
(3)再次计算每个聚类中心
(4)计算标准测度函数,直到达到最大迭代次数,则停止,否则,继续操作。