机器学习总结（十）：常用聚类算法（Kmeans、密度聚类、层次聚类）及常见问题

最新推荐文章于 2024-02-09 14:44:32 发布

VIP文章西电校草

最新推荐文章于 2024-02-09 14:44:32 发布

阅读量7.6k

点赞数 3

分类专栏：聚类机器学习图像处理机器学习总结面试文章标签：机器学习算法面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cppjava_/article/details/71249209

版权

任务：将数据集中的样本划分成若干个通常不相交的子集。

性能度量：类内相似度高，类间相似度低。两大类：1.有参考标签，外部指标；2.无参照，内部指标。

距离计算：非负性，同一性（与自身距离为0），对称性，直递性（三角不等式）。包括欧式距离，曼哈顿距离等等。

（1） K均值聚类步骤：1.随机选择k个样本作为初始均值向量；2.计算样本到各均值向量的距离，把它划到距离最小的簇；3.计算新的均值向量；4.迭代，直至均值向量未更新或到达最大次数。缺点：需要输入k，算法速度依赖于初始化的好坏，不能处理非球形簇。

（2） 密度聚类步骤：DBSCAN，找到几个由密度可达关系导出的最大的密度相连样本集

最低0.47元/天解锁文章

关注

3
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
机器学习总结（十）：常用聚类算法（Kmeans、密度聚类、层次聚类）及常见问题

任务：将数据集中的样本划分成若干个通常不相交的子集。性能度量：类内相似度高，类间相似度低。两大类：1.有参考标签，外部指标；2.无参照，内部指标。距离计算：非负性，同一性（与自身距离为0），对称性，直递性（三角不等式）。包括欧式距离，曼哈顿距离等等。（1） K均值聚类步骤：1.随机选择k个样本作为初始均值向量；2.计算样本到各均值向量的距离，把它划到距离最小的簇；3.计算新的均值
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。