聚类总结

最新推荐文章于 2022-05-14 16:24:20 发布

_Tunan

最新推荐文章于 2022-05-14 16:24:20 发布

阅读量232

点赞数 1

分类专栏：学习整理文章标签：聚类机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/North_City_/article/details/117199932

版权

学习整理专栏收录该内容

6 篇文章 0 订阅

订阅专栏

聚类与分类的区别

Clustering (聚类)，简单地说就是把相似的东西分到一组，聚类的时候，我们并不关心某一类是什么，我们需要实现的目标只是把相似的东西聚到一起。因此，一个聚类算法通常只需要知道如何计算相似度就可以开始工作了，因此 clustering 通常并不需要使用训练数据进行学习，这在Machine Learning中被称作unsupervised learning (无监督学习)。
Classification (分类)，对于一个classifier，通常需要你告诉它“这个东西被分为某某类”这样一些例子，理想情况下，一个 classifier 会从它得到的训练集中进行“学习”，从而具备对未知数据进行分类的能力，这种提供训练数据的过程通常叫做supervised learning (监督学习)。

衡量聚类算法优劣的标准

处理大的数据集的能力；
处理任意形状，包括有间隙的嵌套的数据的能力；
算法处理的结果与数据输入的顺序是否相关，也就是说算法是否独立于数据输入顺序；
处理数据噪声的能力；
是否需要预先知道聚类个数，是否需要用户给出领域知识；
算法处理有很多属性数据的能力，也就是对数据维数是否敏感。

ps：学习自清华大学大数据研究中心

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。