机器学习sklearn(13)层次聚类

层次聚类(Hierarchical Clustering)是聚类算法的一种,基于层次的聚类算法(Hierarchical Clustering)可以是凝聚的(Agglomerative)或者分裂的(Divisive),取决于层次的划分是“自底向上”还是“自顶向下”。
凝聚层次聚类原理是:最初将每个对象看成一个簇,然后将这些簇根据某种规则被一步步合并,就这样不断合并直到达到预设的簇类个数。这里的关键在于:如何计算聚类簇之间的距离? 
  计算聚类簇间距离的方法有三种,分别为Single Linkage,Complete Linkage和Average Linkage。在开始计算之前,我们先来介绍下这三种计算方法以及各自的优缺点。

  • Single Linkage:方法是将两个组合数据点中距离最近的两个数据点间的距离作为这两个组合数据点的距离。这种方法容易受到极端值的影响。两个不相似的组合数据点可能由于其中的某个极端的数据点距离较近而组合在一起。
  • Complete Linkage:Complete Linkage的计算方法与Single Linkage相反,将两个组合数据点中距离最远的两个数据点间的距离作为这两个组合数据点的距离。Complete Linkage的问题也与Single Linkage相反,两个不相似的组合数据点可能由于其中的极端值距离较远而无法组合在一起。
  • Average Linkage:Average Linkage的计算方法是计算两个组合数据点中的每个数据点与其他所有数据点的距离。将所有距离的均值作为两个组合数据点间的距离。这种方法计算量比较大,但结果比前两种方法更合理。

sklearn.cluster.AgglomerativeClustering(n_clusters=

sklearn层次聚类是通过AgglomerativeClustering这个类来实现的。在这个类中,可以通过设置参数来控制层次聚类的具体行为。这个类提供了以下参数:n_clusters表示要聚类的簇的数量,默认为2;affinity表示距离度量的方法,默认为"euclidean";linkage表示连接方式,默认为"ward";distance_threshold表示聚类停止的距离阈值,默认为None。 下面是一个使用sklearn进行层次聚类的示例代码: ```python from sklearn.cluster import AgglomerativeClustering import numpy as np # 创建数据集 data = np.array([[1, 2], [2, 3], [-3, 3], [-2, -1], [5, -1]]) # 训练模型 ac = AgglomerativeClustering(n_clusters=3, affinity='euclidean', linkage='average') clustering = ac.fit(data) # 输出结果 print("每个数据所属的簇编号", clustering.labels_) print("每个簇的成员", clustering.children_) ``` 这段代码中,先创建了一个数据集data,然后通过AgglomerativeClustering类创建了一个层次聚类模型ac,设置了簇的数量为3,距离度量的方法为euclidean,连接方式为average。然后使用fit方法对数据进行训练,最后输出每个数据点所属的簇编号和每个簇的成员信息。 希望这个解答能够帮到你!如果有任何问题,请随时提问。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [机器学习 — python(sklearn / scipy) 实现层次聚类,precomputed自定义距离矩阵](https://blog.csdn.net/pentiumCM/article/details/105695414)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值