scikit-learn算法精讲之层次聚类和树状图

最新推荐文章于 2024-05-16 18:54:59 发布

咖哥

最新推荐文章于 2024-05-16 18:54:59 发布

阅读量3.9k

点赞数

分类专栏： scikit-learn 机器学习文章标签：聚类算法 scikit-learn

本文链接：https://blog.csdn.net/jackyhuang79/article/details/126507927

版权

层次聚类（Hierarchical Clustering）是聚类算法的一族算法的总称，它通过连续合并或拆分聚类来构建嵌套聚类。这种聚类的层次结构就像树一样，树的根是收集所有样本的唯一簇，叶子是只有一个样本的簇。

在这里插入图片描述
上图中，树根聚类就是abcdef，叶子聚类就是每一个字母的节点。

在scikit-learn中，层次聚类可以通过AgglomerativeClustering对象来实现。这个算法使用自下而上的方法执行层次聚类：每次都从其自己的聚类开始，然后将聚类连续合并在一起。

使用鸢尾花数据集，只需要几行代码就通过AgglomerativeClustering完成层次聚类。

先导入NumPy，鸢尾花iris数据集，以及AgglomerativeClustering。

import numpy as np
from sklearn.datasets import load_iris
from sklearn.cluster import AgglomerativeClustering

下面就准备数据并进行聚类。

iris = load_iris()
X = iris.data # 准备聚类的数据（鸢尾花的花瓣和花萼长度特征）

# 创建AgglomerativeClustering对象
model = AgglomerativeClustering(distance_threshold=0, 
                                linkage="ward"， 
                                n_cluste

最低0.47元/天解锁文章

咖哥

关注

0
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
scikit-learn算法精讲之层次聚类和树状图

层次聚类（Hierarchical Clustering）是聚类算法的一族算法的总称，它通过连续合并或拆分聚类来构建嵌套聚类。这种聚类的层次结构就像树一样，树的根是收集所有样本的唯一簇，叶子是只有一个样本的簇。上图中，树根聚类就是abcdef，叶子聚类就是每一个字母的节点。在scikit-learn中，层次聚类可以通过AgglomerativeClustering对象来实现。这个算法使用自下而上的方法执行层次聚类：每次都从其自己的聚类开始，然后将聚类连续合并在一起。
复制链接

扫一扫