聚类算法小结

最新推荐文章于 2024-01-08 01:28:37 发布

luv_dusk

最新推荐文章于 2024-01-08 01:28:37 发布

阅读量995

点赞数 1

文章标签：聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43269174/article/details/96992326

版权

本文介绍了聚类算法的基本概念，包括余弦相似度、欧式距离等评估标准，并详细讲解了K-Means、BIRCH和DBSCAN这三种聚类算法的工作原理和优缺点。K-Means通过迭代将样本分配到最近的簇，BIRCH利用聚类特征树进行层次聚类，而DBSCAN则是一种基于密度的聚类算法，能识别任意形状的簇。

摘要由CSDN通过智能技术生成

目录

- 介绍
- K-Means
- BIRCH
- DBSCAN
- 谱聚类

介绍

聚类算法在于对每一条样本生成固定长度的特征向量，通过数学运算将空间中满足聚类要求的相似样本聚为一类，即我们说的簇。由于聚类算法通常为无监督学习，不需要样本标签，因而成本较低，广泛应用于相似性数据挖掘工作中。应用到推荐领域，可以为用户和产品分组。在介绍常见的聚类算法前，我们先呈现各类相似度的判断标准：

余弦相似度 (Cosine Similarity)：空间中向量夹角的余弦值，用于衡量向量的方向是否一致；
$Cosine\_Similarity(x,y)=\frac{x\cdot y}{||x||\cdot ||y||}$
欧式距离 (Euclidean Distance)：两点之间的最短距离，是对于向量长度和方向的综合评价标准；
$Euclidean(x,y)=||x-y||=\big(\sum_i|x_i-y_i|^2\big)^{\frac{1}{2}}$
曼哈顿距离 (Manhattan Distance)：两点之间的棋盘距离，在特定场景下效用显著；
$Manhattan(x,y)=\sum_i|x_i-y_i|$
闵氏距离 (Minkowski Distance)：欧式距离和曼哈顿距离的泛化版本；
$Minkowski(x,y)=\big(\sum_i|x_i-y_i|^p\big)^{\frac{1}{p}}$

最低0.47元/天解锁文章

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

luv_dusk CSDN认证博客专家 CSDN认证企业博客

码龄6年

31: 原创

5万+: 周排名

101万+: 总排名

11万+: 访问

: 等级

1698: 积分

86: 粉丝

154: 获赞

34: 评论

473: 收藏

私信

关注

热门文章

最新评论

SMART: 通用对抗式训练
weixin_49481023: 大佬怎么不上线了呢
SMART: 通用对抗式训练
橘色的加州陽光: 引用「但实战说话，在我个人的试验下，它在不同任务上都达到了最优异的成绩。至于为何关于 SMART 的讨论热」作者是怎么实验的呢自己复现的吗我也想加在自己的代码里
图路径算法综合
weixin_47194404: 为何我用蚁群算法得出的结果是错的……
AdamW, LAMB: 大型预训练模型常用优化器
蓝色橘猫: 感谢博主，写的很详细，也特别清晰
SMART: 通用对抗式训练
「已注销」: 逻辑如此清晰的文章竟然没啥人看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。