【机器学习】聚类

最新推荐文章于 2024-04-28 21:21:08 发布

CC‘s World

最新推荐文章于 2024-04-28 21:21:08 发布

阅读量1.9k

点赞数 2

分类专栏：机器学习文章标签：聚类算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36643449/article/details/105196170

版权

聚类分析是无监督学习的一种方法，其目标是：使簇内数据之间具有高的相似性，不同簇数据之间具有高的差异性。

经典聚类算法分类：

划分方法：对于给定的n个对象的数据集D，以及簇的数目k，划分算法将对象组织为k个划分。每个划分代表一个簇，使得“簇内相似性高，簇间相似性低”的划分作为最后的聚类结果，例如Kmeans。
层次聚类方法：将数据对象建立一棵聚类树，树的简历策略有自底向上的策略(把小的类别逐渐合并为大的类别，这种方法称为凝聚)和自顶向下的策略(把大的类别逐渐分裂为小的类别，这种方法称为分裂)。在层次聚类的实际应用中，聚类通常终止于某个预先设定的条件，比如簇的数目达到某个预定的值，或者每个簇的直径都在某个阈值之内。
基于密度的聚类方法：将簇看作数据空间中被低密度区域分给开的稠密的对象区域，有时也将这种低密度区域看作噪声。比如DBSCAN方法。

基于密度的簇，是基于密度可达性的最大密度相连对象的集合，不包含在任何簇中的对象被认为是噪声。因此DBSCAN可以在一定的程度上检测出噪声。

第二点强调的是如何能够判定一个簇中含有哪些对象，判定的是寻找核心对象，利用密度可达，来把新的对象加入到某一个簇当中。注意要聚集小簇。
DBSCAN的计算复杂度为O(n^2)，在使用空间索引的数据库

最低0.47元/天解锁文章

博客等级

码龄9年

280
原创

135
点赞

871
收藏

116
粉丝

关注

私信

热门文章

分类专栏

Python 2篇
机器学习 27篇
广告系统 2篇
推荐系统学习 2篇
多模态 25篇
Keras 18篇
算法 11篇
计算机基础 9篇
工程应用 7篇
推荐算法 40篇
PySpark 9篇
C++ 14篇
论文阅读 4篇
TensorFlow 12篇
力扣 54篇
自然语言处理 5篇
MXNet 1篇
Pytorch 13篇
数据结构 2篇
剑指offer编程题 67篇
计算机视觉 1篇

最新评论

【算法】局部敏感哈希 LSH 的 Python 实现
不断生长: 想问一下，这个局部敏感哈希和位置敏感哈希(location sensitive hash)是一样的吗？
【算法】局部敏感哈希 LSH 的 Python 实现
柚子树cc: 后面两个minhash的验证应该使用Jaccard距离吧，找出来的topk明显不太对
【算法】局部敏感哈希 LSH 的 Python 实现
m0_56951613: 最近在学lsh，看了这篇文章有两个问题想问问博主 1、e2lsh不是需要L个哈希函数族，每族k个哈希函数吗，感觉你的代码里好像只有一个哈希函数族，不知道是不是我理解错了 2、经过lsh筛选后，只比较前20个数据的话确实看起来精确度很高，但我输出了candidates发现其实筛选后还有8，9000个数据，也就是说只排除了1000多个数据，我试过其他人的代码，但基本都有这个问题，要保证精确度的话筛选掉的数据量就会很小，想要筛选完的数据量小的话精确度就会很低，是这算法原本的目的就是在海量数据集里筛选掉一小部分的数据吗，还是调参没调好导致效果太差？
【计算机基础】github使用 & git命令
朗197: 帮助很大，非常感谢！！！
【论文阅读】Adaptive Mixtures of Local Experts
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。