K均值算法
一、概念:
形式地,给定n个数据对象的数据集D,以及主要生成的簇数k,划分算法 把数据对象组织成k(k<=n)个分区,其中每个分区代表一个簇,在同一个簇中的对象是“相似的”,而不同簇中的对象时“相异的”。
二、分析:
1、基于距离 给定分区k
2、准则:同一个簇中对象尽可能相近,不同簇中的对象尽可能远离。
3、技术:迭代重定位 组的切换 局部最优解
4、应用场景:中小规模的数据库中的球状簇。
三、算法:
K均值算法
一、概念:
形式地,给定n个数据对象的数据集D,以及主要生成的簇数k,划分算法 把数据对象组织成k(k<=n)个分区,其中每个分区代表一个簇,在同一个簇中的对象是“相似的”,而不同簇中的对象时“相异的”。
二、分析:
1、基于距离 给定分区k
2、准则:同一个簇中对象尽可能相近,不同簇中的对象尽可能远离。
3、技术:迭代重定位 组的切换 局部最优解
4、应用场景:中小规模的数据库中的球状簇。
三、算法: