聚类算法（BIRCH）

最新推荐文章于 2024-03-13 12:45:44 发布

整得咔咔响

最新推荐文章于 2024-03-13 12:45:44 发布

阅读量8.3k

点赞数 5

分类专栏：概率图模型文章标签：聚类算法 python 聚类算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27388259/article/details/112598346

版权

BIRCH（Balanced Iterative Reducing and Clustering using Hierarchies）是一种层次聚类算法，它通过构建聚类特征树（CF Tree）实现快速聚类。算法使用聚类特征（CF）三元组（N，LS，SS）表示样本，以线性关系优化存储。BIRCH的优点包括聚类速度快、能识别噪声点，但对高维和非凸数据集效果不佳。

摘要由CSDN通过智能技术生成

1.层次聚类通过相似度来创建聚类树，把每个样本点当成一个簇

2.BIRCH全称是利用层次方法的平衡迭代规约和聚类

3.BIRCH算法关键是构建聚类特征树

4.聚类特征树由非叶子节点个数B、每个叶子节点的CF数L、半径阈值T决定

5.BIRCH算法聚类速度快、能识别噪音点；但对高维、非凸数据效果不好

K-means是基于质心的聚类算法，谱聚类是基于无向图的聚类方法，这一篇我们介绍一种新的聚类方法——BIRCH算法，开始前先介绍与之相关的聚类算法——层次聚类（Hierarchical Clustering）

算法思路

层次聚类主要通过计算数据点间的相似度来创建一棵有层次的嵌套聚类树，它试图在不同层次对数据集进行划分，从而形成树形的聚类结构。

初始时每个样本各为一簇，然后开始逐步合并的过程，算法步骤如下：

step1：将每个样本都视为一个聚类

step2：计算各个聚类之间的相似度

step3：寻找最近的两个聚类，将他们归为一类

step4：重复步骤二，步骤三；直到所有样本归为一类

我们举个例子来说明这个思想，对于以下一维特征的7个样本点A—G：

注：两个聚类之间相似性的度量采取所有样本距离的均值，这里距离用欧式距离衡量，sklearn包AgglomerativeClustering的参数linkge取“average”：

最低0.47元/天解锁文章

整得咔咔响

关注

5
点赞
踩
56

收藏

觉得还不错? 一键收藏
打赏
0
评论
聚类算法（BIRCH）

1.层次聚类通过相似度来创建聚类树，把每个样本点当成一个簇2.BIRCH全称是利用层次方法的平衡迭代规约和聚类3.BIRCH算法关键是构建聚类特征树4.聚类特征树由非叶子节点个数B、每个...
复制链接

扫一扫

专栏目录

整得咔咔响 CSDN认证博客专家 CSDN认证企业博客

码龄9年

209: 原创

4万+: 周排名

152万+: 总排名

56万+: 访问

: 等级

3245: 积分

422: 粉丝

583: 获赞

92: 评论

3718: 收藏

私信

关注

热门文章

分类专栏

最新评论

概率图模型(总结篇)
m0_47993635: 博主我爱你
你真的理解【条件概率】吗
Oumpi: 我是这么理解：假设换门赢，意味着一开始要选错的；假设不换门赢，意味着一开始要选对的：也就是说换门-赢，实际上取决于第一次的选择，而第一次总是更容易选到错的，所以换门总归赢面更大。但是我总感觉怪怪的，抽奖这种行为怎么能用概率呢，概率不是重复无数次实验趋于稳定的一个值吗，抽奖这种事，就当作是独立事件吧。
分部积分
半缘浅: 好东西要一起分享
直面配分函数（Confronting Partition Function）
m0_74071811: 但是感觉马尔科夫链那里用配合书上的受限玻尔兹曼机更好
直面配分函数（Confronting Partition Function）
m0_74071811: 比花书上讲的详细

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

整得咔咔响 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。