Kmeans:
优点:
简单易实现
缺点:
可能收敛于局部最小值(对初始k个聚类中心的选择敏感),在大规模数据集上收敛较慢
适用数据类型:数值型数据
度量聚类效果的指标:
SSE(sum of squared error, 误差平方和),SSE值越小表示数据点越接近于他们的质心,聚类效果也越好
改进方法:簇划分
二分k均值算法:
请参考博客:http://blog.csdn.net/u013593585/article/details/51263980
Kmeans:
优点:
简单易实现
缺点:
可能收敛于局部最小值(对初始k个聚类中心的选择敏感),在大规模数据集上收敛较慢
适用数据类型:数值型数据
度量聚类效果的指标:
SSE(sum of squared error, 误差平方和),SSE值越小表示数据点越接近于他们的质心,聚类效果也越好
改进方法:簇划分
二分k均值算法:
请参考博客:http://blog.csdn.net/u013593585/article/details/51263980