分类与聚类的比较
- 聚类分析是研究如何在没有训练的条件下把样本划分为若干类。
- 在分类中,已知存在哪些类,即对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪一类标记出来。
- 聚类需要解决的问题是将已给定的若干无标记的模式聚集起来使之成为有意义的聚类,聚类是在预先不知道目标数据库到底有多少类的情况下,希望将所有的记录组成不同的类或者说聚类,并且使得在这种分类情况下,以某种度量(例如:距离)为标准的相似性,在同一聚类之间最小化,而在不同聚类之间最大化。
- 与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据样本有类别标记。
数据的聚类(cluster)|| 关联规则 || 回归
最新推荐文章于 2022-12-14 14:25:18 发布
本文对比了分类与聚类的区别,聚类是无监督学习,旨在将无标记的样本聚集为有意义的类。关联规则探讨了在数据中寻找项集之间的频繁模式,而回归分析关注自变量与因变量的一一对应关系,不局限于直线形式。
摘要由CSDN通过智能技术生成