Birch

目录

什么是BIRCH?

聚类特征CF:

CF Tree的生成:

BIRCH优点:

BIRCH缺点:


先贴出我借鉴的博客

  1. https://www.cnblogs.com/pinard/p/6179132.html
  2. https://blog.csdn.net/congnaahahei/article/details/78881128

什么是BIRCH?

       BIRCH的全称是利用层次方法的平衡迭代规约和聚类(Balanced Iterative Reducing and Clustering Using Hierarchies),这个聚类算法只需要单遍扫描数据集就能进行聚类,BIRCH利用了一个树结构来帮助我们快速的聚类,这个树结构类似于平衡B+树,一般将它称之为聚类特征树(Clustering Feature Tree,简称CF Tree),这颗树的每一个节点是由若干个聚类特征(Clustering Feature,简称CF)组成。CF树的结构是:每个节点包括叶子节点都有若干个CF,而内部节点的CF有指向孩子节点的指针,所有的叶子节点用一个双向链表链接起来。(如下图)

                        


聚类特征CF:

       每一个CF是一个三元组,可以用(N,LS,SS)表示。其中N代表了这个CF中拥有的样本点的数量;LS代表了这个CF中拥有的样本点各特征维度的和向量,SS代表了这个CF中拥有的样本点各特征维度的平方和。

       举例: 

                                  

在这个结点中共有5个样本(N=5),每个样本的对应x坐标相加为LS(x)=3+2+4+4+3=16, y坐标相加为LS(y)=4+6+5+7+8&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值