回归问题是指f(x)是一个连续的值,给定一个新的模式,根据训练集推断它所对应的输出值(实数)是多少,是一种定量输出,也叫连续变量预测。
分类问题是指f(x)是一个离散的值,给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测。
举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨,就是一个分类任务。
其实回归问题和分类问题的本质一样,都是针对一个输入做出一个输出预测,其区别在于输出变量的类型。
解决回归和分类问题的步骤:
1.如何选取一个 合理的模型(线性or 非线性【 阶跃函数, 高斯函数】).
2.制造一个"美好"的 误差函数【也称损失函数】 (可以评估拟合程度,而且还是convex函数)
3.采取一切可能的技术(e.g. 导数下降法,解极值方程法) 求出最好的模型参数