大数据:聚类
下面是我看《大数据—互联网大规模数据挖掘与分布式处理》一书第七章的总结。
1 聚类:促某空间下点形式的有用的概要表示。为了对点进行聚类,需要在该空间下定义一个距离测度。
2 聚类算法:层次聚类算法 将每个点自己都看成一个簇,然后相近的簇进行合并。点分配聚类算法依次考虑每个点并将他们分配到最符合的簇。
1 聚类:促某空间下点形式的有用的概要表示。为了对点进行聚类,需要在该空间下定义一个距离测度。
2 聚类算法:层次聚类算法 将每个点自己都看成一个簇,然后相近的簇进行合并。点分配聚类算法依次考虑每个点并将他们分配到最符合的簇。