数据挖掘中分类和聚类的区别

最新推荐文章于 2023-02-16 13:13:25 发布

weixin_12345

最新推荐文章于 2023-02-16 13:13:25 发布

阅读量5k

点赞数 1

分类专栏：数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43321444/article/details/89474877

版权

数据挖掘专栏收录该内容

7 篇文章 1 订阅

订阅专栏

分类是根绝以往的数据和结果对一部分数据进行结果的预测。有监督学习。
分类预测的基本过程：历史数据是训练数据，要预测的数据称为测试数据，而结果称为类标签。分类预测主要有学习和分类两个阶段：利用数据进行模型参数的调节过程称为训练和学习，训练的结果是产生一个分类器或者分类模型，进而可以根据这个模型对测试数据进行预测，得到相应的类标签结果。类标签的数据种类分为二分类或多酚类。
训练数据是有已知的类标签，而且训练数据除类标签外，其余部分的结构和测试数据需要完全一致，即特征数量要对应。
分类算法有：决策树、朴素贝叶斯，神经网络，SVM，逻辑回归。

聚类：将本身没有类别的样本聚集称不同的组，这样的一组数据对象的集合称为簇，并且对每一个这样的簇都进行描述的过程。聚类的目的是使属于同一个簇的样本之间彼此相似，而不同簇的样本之间足够不相似。
与分类不同的是：进行聚类前并不知道将要划分的组的个数和类型，没有定义标签或者目标值，聚类归于无监督学习任务。
聚类方法：K-means, k-中心点法。

尤其是在处理海量数据的时候，如果通过预处理使得数据满足分类算法的要求，则代价非常大，这时候可以考虑使用聚类算法

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。