25、python分层聚类案例（sklearn方法）

最新推荐文章于 2025-03-21 10:13:52 发布

UP Lee

最新推荐文章于 2025-03-21 10:13:52 发布

阅读量7.4k

点赞数 1

分类专栏：数据挖掘实战文章标签： python分层聚类 sklearn分层聚类

本文链接：https://blog.csdn.net/qq_36327687/article/details/85694919

版权

这篇博客介绍了如何利用sklearn库进行分层聚类，包括ward、最大连通性和平均连通性三种方法，并提供了实际案例来演示这些方法的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 sklearn层次聚类

01 ward

最小化所有聚类内的平方差总和，这是一种方差最小化的优化方向，这是与k-means的目标韩式相似的优化方法，但是用聚类分层的方法处理。

02 Maximum 或者complete linkage 最小化聚类对样本之间的最大距离

03 Average linkage 最小化聚类两个聚类中样本之间的最大距离

2 案例

import pandas as pd


data=pd.read_csv('D:\\DATA\\pycase\\7.1\\data.csv',
                 index_col='客户编号')

# 提取关键特征 data.columns

fColumns=[ '工作日上班时电话时长', '工作日下半时电话时长', '周末电话时长', '国际电话时长']

# 数据标准化0-1标准化

data=data[fColumns]

data[fColumns]=round(
        (data[fColumns]-data[fColumns].min())/(data[fColumns].max()-data[fColumns].min()),
        3)

# 导入层次聚类函数
from scipy.cluster.hierarchy import linkage,dendrogram

Z=linkage(data[fColumns],method='ward',metric='euclidean') #p谱系聚类图

P=dendrogram(Z,0) # 画谱系聚类图

''' 只展示12个数据
P1=dendrogram(Z,
        truncate_mode