BIRCH详解

最新推荐文章于 2022-07-21 11:31:06 发布

Leon1895

最新推荐文章于 2022-07-21 11:31:06 发布

阅读量792

点赞数 1

分类专栏：机器学习文章标签： BIRCH 可伸缩聚类

本文链接：https://blog.csdn.net/qq_40793975/article/details/83859250

版权

BIRCH（Balanced Iterative Reducing and Clustering using Hierarchies）是一种可伸缩聚类算法，通过构建聚类特征树（CF-Tree）来处理大规模数据。算法包括扫描数据、生成CF-Tree、全局聚类和结果细化等步骤。CF由N、LS和SS组成，用于表征聚类特征。CF-Tree的构建过程中，通过调整阈值B、L、T控制树的规模。BIRCH算法适用于内存有限的情况，通过迭代优化提供聚类效果。

摘要由CSDN通过智能技术生成

BIRCH（Balanced Iterative Reducing and Clustering using Hierarchies）详解

第三十次写博客，本人数学基础不是太好，如果有幸能得到读者指正，感激不尽，希望能借此机会向大家学习。这一篇作为可伸缩聚类（Scalable Clustering）算法的第三篇，主要是对BIRCH（Balanced Iterative Reducing and Clustering using Hierarchies）算法进行详细介绍，其他可伸缩聚类算法的链接可以从《可伸缩聚类算法综述（可伸缩聚类算法开篇）》这篇文章中找到。

CF和CF-Tree

聚类特征（Clustering Feature，简称CF）是一种用来表征聚类特征的数据格式，他由以下三部分组成：簇中所含样本点的个数（用 $N$ 来表示）、簇中所有点的各项属性的线性和（用 $L S$ 来表示）以及簇中所有点的各项属性的平方和（用 $S S$ 来表示），假设存在簇 $C=\{\left(1,2\right),\left(2,1\right),\left(1,1\right),\left(2,2\right)\}$ ，那么 $N = 4$ ，

最低0.47元/天解锁文章

Leon1895

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
BIRCH详解

BIRCH（Balanced Iterative Reducing and Clustering using Hierarchies）详解第三十次写博客，本人数学基础不是太好，如果有幸能得到读者指正，感激不尽，希望能借此机会向大家学习。这一篇作为可伸缩聚类（Scalable Clustering）算法的第三篇，主要是对BIRCH（Balanced Iterative Reducing and ...
复制链接

扫一扫

专栏目录