首先,我们要明确什么是回归,回归和分类的区别是什么?
分类和回归的区别在于输出变量的类型。 定量输出称为回归,或者说是连续变量预测; 定性输出称为分类,或者说是离散变量预测。 举个例子: 预测明天的气温是多少度,这是一个回归任务; 预测明天是阴、晴还是雨,就是一个分类任务。
线性回归?
如果每个样本只有一个属性,以下图为例,y是待估计的值,x是一个属性。
以上图为例,我们需要根据已有的样本(也就是上图中的点)估计合适的参数a和b
现在我们来重新说明下我们的目的,我们是要找到这样的一个函数h(x),这个函数有theta0,theta1,....,thetan这么多个参数,使得这个函数能尽量的拟合已有的样本。
,其中我们在每个样本的第一列加了一个x0=1,使得theta0作为截距,