1)输出数据的类型不同
分类输出的数据类型是离散数据,也就是分类的标签。比如通过学生学习预测考试是否通过,这里的预测结果是考试通过,或者不通过,这2种离散数据回归输出的数据类型是连续数据。比如通过学习时间预测学生的考试分数,这里的预测结果分数,是连续数据。
2)第2个区别是我们想要通过机器学习算法得到什么
分类算法得到的是一个决策面,用于对数据集中的数据进行分类。
回归算法得到的是一个最优拟合线,这个线条可以最好的接近数据集中的各个点。3)第3个区别是对模型的评估指标不一样
在监督分类中,我们通常会使用正确率作为指标,也就是预测结果中分类正确数据占总数据的比例。
在回归中,我们决定系数R平方来评估模型的好坏。R平方表示有多少百分比的y波动被回归线描述。4)分类与聚类的区别
4.1.对于分类来说,在对数据集分类时,我们是知道这个数据集是有多少种类的,比如对一个学校的在校大学生进行性别分类,我们会下意识很清楚知道分为“男”和“女”。
4.2.而对于聚类来说,在对数据集操作时,我们是不知道该数据集包含多少类,我们要做的是将数据集中相似的数据归纳在一起。比如预测某一学校的在校大学生的好朋友团队,
我们不知道大学生和谁玩的好玩的不,我们通过他们的相似度进行聚类,聚成n个团队,这就是聚类。聚类是将数据对象的集合分成相似的对象类的过程。使得同一个簇(或类)
中的对象之间具有较高的相似性,而不同簇中的对象具有较高的相异性。