数据挖掘笔记-聚类-Canopy-原理与简单实现

人生偌只如初见

已于 2023-01-30 18:19:36 修改

阅读量6.3k

点赞数 2

分类专栏： DataMining 文章标签：数据挖掘聚类 Canopy Java

于 2014-06-12 18:02:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fighting_one_piece/article/details/30272411

版权

Canopy算法是一种快速聚类方法，通过T1和T2距离阈值进行数据分组。常用于数据预处理，能为后续精确聚类提供辅助。文章介绍了算法步骤，并提供了简单的二维点Java实现。

摘要由CSDN通过智能技术生成

Canopy聚类算法是一个将对象分组到类的简单、快速、精确地方法。每个对象用多维特征空间里的一个点来表示。这个算法使用一个快速近似距离度量和两个距离阈值 T1>T2来处理。基本的算法是，从一个点集合开始并且随机删除一个，创建一个包含这个点的Canopy，并在剩余的点集合上迭代。对于每个点，如果它的距离第一个点的距离小于T1，然后这个点就加入这个聚集中。除此之外，如果这个距离<T2，然后将这个点从这个集合中删除。这样非常靠近原点的点将避免所有的未来处理，不可以再做其它Canopy的中心。这个算法循环到初始集合为空为止，聚集一个集合的Canopies，每个可以包含一个或者多个点。每个点可以包含在多于一个的Canopy中。

Canopy算法其实本身也可以用于聚类，但它的结果可以为之后代价较高聚类提供帮助，其用在数据预处理上要比单纯拿来聚类更有帮助。Canopy聚类经常被用作更加严格的聚类技术的初始步骤，像是K均值聚类。建立canopies之后，可以删除那些包含数据点数目较少的canopy，往往这些canopy是包含孤

最低0.47元/天解锁文章

人生偌只如初见

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

人生偌只如初见 CSDN认证博客专家 CSDN认证企业博客

码龄16年

153: 原创

2万+: 周排名

1万+: 总排名

50万+: 访问

: 等级

6049: 积分

610: 粉丝

180: 获赞

138: 评论

313: 收藏

私信

关注

热门文章

分类专栏

NebulaGraph 2篇
Doris 1篇
DataMining 49篇
Python 33篇
J2EE 26篇
ElasticSearch 14篇
Spark 12篇
XXL-JOB 3篇
Neo4j 4篇
Flink 2篇
Hadoop 6篇
ES-Hadoop 2篇
HBase 6篇
Hive 3篇
Tez 2篇
Kafka 5篇
Storm 3篇
JStorm 1篇
Tachyon 2篇
Oozie 1篇
Cassandra 1篇
Titan 2篇
Lucene 1篇
Redis 4篇
MongoDB 3篇
Akka 1篇
DataX 3篇
Crawler 4篇
Docker 3篇

最新评论

Java学习笔记-EXCEL文件的读写操作
qq_27475765: String sheetId = "rId1"; 这个rld1是怎么知道的。
Sanic学习笔记-搭建简单WEB基础框架
jeffreyshou: 老大，《Sanic学习笔记-搭建简单WEB基础框架》完整代码有吗？想学习下，谢谢
ElasticSearch学习笔记-Vector向量搜索记录
jasstion: 搜索速度会根据数据规模线性增加，如果数据量大的话，不太可行，可以参考基于elasticsearch实现大规模向量检索这篇csdn博客，将向量搜索转成全文检索，搜索速度以及效率大大提升。
Neo4j学习笔记-Embedded嵌入模式简单示例
rainysky7: 请问作者有NEO4J的学习资源嘛，我想付费获取。最近在做一个用java开发后端的小项目，需要用NEO4J来做数据库，用java操作Neo4j，想找资料学习
Sanic学习笔记-搭建简单WEB基础框架
LaoYuanPython: 有幸阅读博主才出炉不到2天的大作！谢谢博主提供的案例代码分享!如此好文,点赞感谢！欢迎博主到本人的Python专栏来交流！

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。