用Python实现K-Means算法,以鸢尾花数据为例
一、K-Means算法:
1、随机选取K个样本作为类中心;
2、计算各样本与各类中心的距离;
3、将各样本归于最近的类中心点;
4、求各类的择本均值,作为新的类中心;
5、判定:若类中心不再发生变动或达到迭代次数,算法结束,否则刚回刻第2步。
算法优点:
1、算法简单,易于理解;
2、对球状簇样本聚类效果好;
3、二分k均值等变种算法运行良好,不受初始化问题的影响。
缺点:
1.不能处理非球形簇、不同尺寸和不同密度的簇;
2.对离群点、噪声敏感。
二、代码实现:
from sklearn.datasets
原创
2020-06-15 10:11:21 ·
3611 阅读 ·
1 评论