密度聚类 dbscan

最新推荐文章于 2023-05-21 17:10:53 发布

assassin_sword

最新推荐文章于 2023-05-21 17:10:53 发布

阅读量248

点赞数

分类专栏： Python数据分析机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41521681/article/details/90476232

版权

Python数据分析同时被 2 个专栏收录

75 篇文章 10 订阅

订阅专栏

11 篇文章 0 订阅

订阅专栏

层次聚类方法

n凝聚的层次聚类：自底向上，首先将每个对象作为一个簇，然后合并这些原子簇为越来越大的簇，直到某个终结条件被满足。

n分裂的层次聚类：自顶向下，它首先将所有对象置于一个簇中，然后逐渐细分为越来越小的簇，直到达到了某个终结条件。

n层次凝聚的代表是AGNES算法。层次分裂的代表是DIANA算法。

优缺点：

n层次聚类方法是不可逆的，也就是说，当通过凝聚式的方法将两组合并后，无法通过分裂式的办法再将其分离到之前的状态，反之亦然。

n另外，层次聚类过程中调查者必须决定聚类在什么时候停止，以得到某个数量的分类。

在不必要的情况下应该小心使用层次聚类方法

基于密度的聚类方法

n划分和层次方法旨在发现球状簇。他们很难发现任意形状的簇。

n改进思想：将簇看作数据空间中由低密度区域分隔开的高密度对象区域。

n过滤噪声孤立点数据，发现任意形状的簇。

¨DBSCAN：基于高密度连通区域聚类

¨OPTICS：通过点排序识别聚类结构

¨DENCLUE:基于密度分布函数的聚类

特点：

•抗噪声

• 能处理任意形状聚类

n时间复杂度

¨DBSCAN算法要对每个数据对象进行邻域检查时间性能较低。
¨DBSCAN的基本时间复杂度是 O(n*找出ε-邻域中的点所需要的时间)。最坏情况下时间复杂度是O(n2)
¨在低维空间数据中,有一些数据结构如K-D树，使得可以有效的检索特定点给定距离内的所有点，时间复杂度可以降低到O(nlogn)

n空间复杂度

在聚类过程中，DBSCAN一旦找到一个核心对象，即以该核心对象为中心向外扩展．此过程中核心对象将不断增多，未处理的对象被保留在内存中．若数据库中存在庞大的聚类，将需要很大的存来存储核心对象信息，其需求难以预料．
当数据量增大时，要求较大的内存支持 I/0 消耗也很大;
低维或高维数据中，其空间都是O(n)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
密度聚类 dbscan

层次聚类方法 n凝聚的层次聚类：自底向上，首先将每个对象作为一个簇，然后合并这些原子簇为越来越大的簇，直到某个终结条件被满足。 n分裂的层次聚类：自顶向下，它首先将所有对象置于一个簇中，然后逐渐细分为越来越小的簇，直到达到了某个终结条件。 n层次凝聚的代表是AGNES算法。层次分裂的代表是DIANA算法。 ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。