1. 概念区分
这里根据西瓜书上的说法对这几个概念做一下区分。
首先,根据训练数据是否有标记信息,将学习任务分为“监督学习”和“无监督学习”。其中分类和回归是前者的代表,聚类是后者的代表。
其次,三者都是针对预测问题。如果预测的值是离散的,称为“分类”,如果是连续的,称为“回归”,如果事先没有标记信息(或者说训练集没有标准答案),那么就称为“聚类”。
2. 常见算法
2.1 回归算法
线性回归
多项式回归
逐步回归:只保留对Y有显著影响的变量。
八种常见回归算法解析及代码_TingXiao-Ul的博客-CSDN博客_回归算法
2.2 分类算法
logistic回归:虽然是回归,但属于分类算法,处理的是分类变量。
K-近邻算法:找出与未知样本x距离最近的k个训练样本,看这k个样本中多数属于哪一类。
神经网络
2.3 聚类算法
K-means