经典聚类算法总结

最新推荐文章于 2024-03-20 16:08:19 发布

VIP文章 lettyxiaoxiao

最新推荐文章于 2024-03-20 16:08:19 发布

阅读量3.9k

点赞数 1

分类专栏：总结文章标签：大数据 clustering 算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lettyxiaoxiao/article/details/44828187

版权

时间复杂度只跟循环次数有关，与循环里有多少条语句无关。

DBSCAN:

density-based clustering：聚类参数：eps，min-samples（一个点在eps范围内有最小min-samples个点则定义为core point）

有三类点：core points，none-core point（在一个core point 的eps范围内，但是自己不是），outlier（既不是core point，也不在任何一个core point的eps内）

噪声点会被滤除，不产生完全聚类。

目的是寻找被低密度区域分离出的高密度区域。

时间复杂度：O（N*找到eps领域内点的时间），最坏O（ N**2）,最好O（N*logN）

k-means：

适用于凸状的，不适用于细长的或是不规则的形状的。

对于高维数据，欧式距离会膨胀，可以先用PCA降维。PCA：主成分分析，从原来的几个维度中提取综合出新的正交的代表原来变量的少数维度。

基于初始点的选择，算法很可能陷入局部最优，可以进行多次聚类减少这一误差，在python中，使用设置init='kmeans++'参数可以将初始点设置的尽量远一些。

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
经典聚类算法总结

时间复杂度只跟循环次数有关，与循环里有多少条语句无关。DBSCAN:density-based clustering：聚类参数：eps，min-samples（一个点在eps范围内有最小min-samples个点则定义为core point）有三类点：core points，none-core point（在一个core point 的eps范围内，但是自己不是），outlier（
复制链接

扫一扫

专栏目录

lettyxiaoxiao CSDN认证博客专家 CSDN认证企业博客

码龄9年

1: 原创

87万+: 周排名

187万+: 总排名

3942: 访问

: 等级

52: 积分

1: 粉丝

1: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

经典聚类算法总结 3943

分类专栏

总结 1篇

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。