机器学习（十）----聚类的扩展

最新推荐文章于 2023-04-29 14:23:58 发布

路易三十六

最新推荐文章于 2023-04-29 14:23:58 发布

阅读量632

点赞数

分类专栏：机器学习文章标签：模糊聚类离群值检测(异常检测、孤立点检测) 评估聚类质量(聚类效果好不好) 簇数制定(数据集分成K类，K的确定) 估计聚类趋势(判定数据集是否真的适合用做聚类)

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LuYi_WeiLin/article/details/86419028

版权

本文深入探讨聚类分析，包括估计数据集的聚类趋势、确定合适的簇数方法如肘方法和信息论标准、评估聚类质量的内外在方法。此外，还介绍了模糊聚类的概念和SSE度量，以及离群值检测的各种策略，如基于统计和邻近性的方法。

摘要由CSDN通过智能技术生成

机器学习（十）----聚类的扩展

这篇文章主要讲解以下知识点：

估计聚类趋势(判定数据集是否真的适合用做聚类)
簇数制定(数据集分成K类，K的确定)
评估聚类质量(聚类效果好不好)
模糊聚类
离群值检测(异常检测、孤立点检测)

估计聚类趋势（聚类工作第一步）

均匀分布以及随机分布的点集一般聚类是没有什么意义的，那如何评估？

霍普金斯统计量：空间统计量，检验空间随机性

相关解读（一般霍普金斯统计量越接近于0，证明数据集聚类有意义）

簇数制定

平时一般簇数制定都是根据分析师的经验来制定的，但是其实还是有一些办法的，比如：

经验判断，例如样本点数目为n，则取k=sqrt（n/2）
肘方法

最低0.47元/天解锁文章

路易三十六

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习（十）----聚类的扩展

机器学习（十）----聚类的扩展这篇文章主要讲解以下知识点：估计聚类趋势(判定数据集是否真的适合用做聚类) 簇数制定(数据集分成K类，K的确定) 评估聚类质量(聚类效果好不好) 模糊聚类离群值检测(异常检测、孤立点检测) 估计聚类趋势（聚类工作第一步）均匀分布以及随机分布的点集一般聚类是没有什么意义的，那如何评估？霍普金斯统计量：空间统计量，检验空间随机性...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

路易三十六 你的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。