聚类算法就是按照某个特定的标准(如距离准则)把一个数据集分割成不同的类或簇,使得同个簇内的数据对象相似性尽可能大,同时不同簇内的差异性尽可能大。
聚类算法评价指标:
聚错样本数、运行时间、平均准确度()
聚类算法比较:
- FCM和K-means都具有较高的准确度,层次聚类准确度最差,SOM耗时较长。
- K-means 受限于初始点的选取
- FCM 人为确定聚类数,易陷入局部最优解
- SOM 处理时间长
- 层次聚类 一旦被合并就不能修正,聚类质量受限
聚类算法就是按照某个特定的标准(如距离准则)把一个数据集分割成不同的类或簇,使得同个簇内的数据对象相似性尽可能大,同时不同簇内的差异性尽可能大。
聚类算法评价指标:
聚错样本数、运行时间、平均准确度()
聚类算法比较: