[机器学习和数据分析] 分类与聚类

最新推荐文章于 2023-03-03 23:36:48 发布

呦柚子

最新推荐文章于 2023-03-03 23:36:48 发布

阅读量586

点赞数

分类专栏：机器学习与数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34176797/article/details/118854262

版权

本文探讨了机器学习中的分类与聚类概念。分类是监督学习，需要预先定义类别的信息，而聚类是无监督学习，旨在发现数据的内在结构。两者在应用场景上有所不同，分类适用于已知类别的数据，而聚类则适用于未知类别或分类体系不明确的情况。

摘要由CSDN通过智能技术生成

分类

分类（classification）：分类任务就是通过学习得到一个目标函数f，把每个属性集x映射到一个预先定义的类标号y中。
分类是根据一些给定的已知类别标号的样本，训练某种学习机器（即得到某种目标函数），使它能够对未知类别的样本进行分类。这属于supervised learning（监督学习）。
通过学习来得到样本属性与类标号之间的关系。
局限：作为一种监督学习方法，要求必须事先明确知道各个类别的信息，并且断言所有待分类项都有一个类别与之对应。但是很多时候上述条件得不到满足，尤其是在处理海量数据的时候，如果通过预处理使得数据满足分类算法的要求，则代价非常大，这时候可以考虑使用聚类算法。

聚类

聚类指事先并不知道任何样本的类别标号，希望通过某种算法来把一组未知类别的样本划分成若干类别，聚类的时候，并不关心某一类是什么，需要实现的目标只是把相似的东西聚到一起，这在机器学习中被称作 unsupervised learning （无监督学习）。
通常，人们根据样本间的某种距离或者相似性来定义聚类，即把相似的（或距离近的）样本聚为同一类，而把不相似的（或距离远的）样本归在其他类。
目标：组内的对象相互之间是相似的（相关的），而不同组中的对象是不同的（不相关的）。组内的相似性越大，组间差别越大࿰

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。