matlab层次聚类中birch,Birch层次聚类

最新推荐文章于 2021-03-23 18:23:15 发布

weixin_31100203

最新推荐文章于 2021-03-23 18:23:15 发布

阅读量945

点赞数 1

文章标签： matlab层次聚类中birch

BIRCH（Basic Iterative Reduction and Clustering Using Clusters）是一种适用于大数据集的层次聚类算法，它通过创建聚类特征树（CF Tree）实现高效聚类。本文详细介绍了CF特征、CF Tree的构建过程，以及BIRCH算法的流程，包括叶节点和内部节点的分裂策略。BIRCH的优点在于节省内存和快速聚类，但可能不适合高维数据和非凸形状的簇。

摘要由CSDN通过智能技术生成

Birch层次聚类算法

标签(空格分隔)： CF树建立

BIRCH算法比较适合于数据量大，类别数K也比较多的情况。它运行速度很快，只需要单遍扫描数据集就能进行聚类，当然需要用到一些技巧，下面我们就对BIRCH算法做一个总结。

【个人建议，如想要自己写CF树生成代码前，请先了解一下B+树的构造与写法对之后的代码完成将会有帮助。】

1.聚类特征CF与聚类特征树CF Tree

在聚类特征树中，一个聚类特征CF是这样定义的：每一个CF是一个三元组，可以用(N，LS，SS)表示。其中N代表了这个CF中拥有的样本点的数量，这个好理解；LS代表了这个CF中拥有的样本点各特征维度的和向量，SS代表了这个CF中拥有的样本点各特征维度的平方和。举个例子如下图，在CF Tree中的某一个节点的某一个CF中，有下面5个样本(3,4), (2,6), (4,5), (4,7), (3,8)。则它对应的N=5， LS= (3+2+4+4+3,4+6+5+7+8) =(16,30), SS = (32+22+42+42+32+42+62+52+72+82) = (54+190) = 244。具体内容可如下所示：

CF有一个很好的性质，就是满足线性关系，也就是CF1+CF2=(N1+N2,LS1+LS2,SS1+SS2)。这个性质从定义也很好理解。如果把这个性质放在CF Tree上，也就是说，在CF Tree中，对于每个父节点中的CF节点，它的(N,LS,SS)三元组的值等于这个CF节点所指向的所有子节点的三元组之和。如下图所示：

从上图中可以看出，根节点的CF1的三元组的值，可以从它指向的6个子节点(CF7 - CF12)的值相加得到。这样我们在更新CF Tree的时候，可以很高效。

对于CF Tree，

最低0.47元/天解锁文章

weixin_31100203

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
matlab层次聚类中birch,Birch层次聚类

Birch层次聚类算法标签(空格分隔)： CF树建立BIRCH算法比较适合于数据量大，类别数K也比较多的情况。它运行速度很快，只需要单遍扫描数据集就能进行聚类，当然需要用到一些技巧，下面我们就对BIRCH算法做一个总结。【个人建议，如想要自己写CF树生成代码前，请先了解一下B+树的构造与写法对之后的代码完成将会有帮助。】1.聚类特征CF与聚类特征树CF Tree在聚类特征树中，一个聚类特征CF是这...
复制链接

扫一扫