一种用于聚类的常用算法,相较于Kmeans,优点有:
无需事先指定聚类组数
对噪声不敏感
对原始数据集的分布要求低
缺点:
数据量较大时处理速度慢
原理详解:
http://shiyanjun.cn/archives/1288.html
初级使用方法(主要是调参):
http://www.cnblogs.com/pinard/p/6217852.html
以上链接也给出了一种比较典型的不太适合使用k-means进行聚类的数据集分布情况
http://blog.csdn.net/sandyzhs/article/details/46773731
Python实现:
http://www.cnblogs.com/wsine/p/5180778.html
C++实现:
http://blog.csdn.net/k76853/article/details/50440182