聚类算法(BIRCH)

BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)是一种层次聚类算法,它通过构建聚类特征树(CF Tree)实现快速聚类。算法使用聚类特征(CF)三元组(N,LS,SS)表示样本,以线性关系优化存储。BIRCH的优点包括聚类速度快、能识别噪声点,但对高维和非凸数据集效果不佳。
摘要由CSDN通过智能技术生成

1.层次聚类通过相似度来创建聚类树,把每个样本点当成一个簇

2.BIRCH全称是利用层次方法的平衡迭代规约和聚类

3.BIRCH算法关键是构建聚类特征树

4.聚类特征树由非叶子节点个数B每个叶子节点的CF数L、半径阈值T决定

5.BIRCH算法聚类速度快、能识别噪音点;但对高维、非凸数据效果不好

K-means是基于质心的聚类算法,谱聚类是基于无向图的聚类方法,这一篇我们介绍一种新的聚类方法——BIRCH算法,开始前先介绍与之相关的聚类算法——层次聚类(Hierarchical Clustering)

算法思路

层次聚类主要通过计算数据点间的相似度来创建一棵有层次的嵌套聚类树,它试图在不同层次对数据集进行划分,从而形成树形的聚类结构。

初始时每个样本各为一簇,然后开始逐步合并的过程,算法步骤如下:

step1:将每个样本都视为一个聚类

step2:计算各个聚类之间的相似度

step3:寻找最近的两个聚类,将他们归为一类

step4:重复步骤二,步骤三;直到所有样本归为一类

我们举个例子来说明这个思想,对于以下一维特征的7个样本点A—G:

注:两个聚类之间相似性的度量采取所有样本距离的均值,这里距离用欧式距离衡量,sklearn包AgglomerativeClustering的参数linkge取“average”:

  • 5
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

整得咔咔响

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值