聚类方法——簇间距离度量方法

1.  最小距离(单链接算法 Single linkage algorithm) 

    含义:簇类C1和C2的距离由该两个簇的最近样本决定。

                                                                 $$ dis{t_{\min }}\left( {C1,C2} \right) = \mathop {\min }\limits_{​{P_i} \in C1,{P_j} \in C2} dist\left( {​{P_i},{P_j}} \right)

    优点:只要两个簇类的间隔不是很小,单链接算法可以很好的分离非椭圆形状的样本分布。

    缺点:单链接算法不能很好的分离簇类间含有噪声的数据集。

2.  最大距离(全链接算法 Complete linkage algorithm)

    含义:簇类C1和C2的距离由该两个簇的最远样本决定。

                                                               

  • 8
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
层次聚类分析是一种基于距离度量聚类算法,它通过计算不同样本之间的距离,将样本逐步合并为越来越大的簇,直至达到预设的聚类数量或者满足某种条件为止。 在基站定位数据商圈分析中,我们可以将商圈看作是一个点集合,每个点表示商圈中心的位置。我们可以使用层次聚类分析对这些点进行聚类,从而发现不同的商圈、商圈之间的相似性以及热门商圈的分布情况。 下面是一个使用Python进行层次聚类分析的示例代码: ```python import pandas as pd import numpy as np from scipy.spatial.distance import pdist, squareform from scipy.cluster.hierarchy import linkage, dendrogram # 读取商圈数据 df = pd.read_csv('business_districts.csv') # 计算商圈之间的距离矩阵 dist_matrix = pdist(df.iloc[:, 1:], metric='euclidean') # 使用Ward方法进行层次聚类 linkage_matrix = linkage(dist_matrix, method='ward') # 绘制树状图 dendrogram(linkage_matrix) # 显示结果 plt.show() ``` 在上面的代码中,我们首先读取了商圈数据,并计算了商圈之间的欧几里得距离矩阵。然后使用Ward方法进行层次聚类,并绘制了树状图。 树状图可以帮助我们直观地了解聚类结果,其中每个叶节点表示一个商圈,不同颜色的线段表示不同的簇。我们可以根据树状图中的切割点,将商圈分成不同的簇,从而得到不同的商圈群组。 除了树状图,我们还可以使用其他的聚类评估指标,如轮廓系数、Calinski-Harabasz指数等,来评估聚类结果的质量。最终,我们可以根据聚类结果,进一步分析商圈的特点和分布情况,为商业决策提供参考。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值