线性回归
线性回归是统计学中最基本的数学模型,它的基本数学表述为: y=ax+b y = a x + b ,其中的 x x 自变量,在数据分析(机器学习)中被称为特征值(features), 被称为因变量,数据分析(机器学习)中被称为标签(labels)。当我们知道两组组 x,y x , y 的时候,我们就可以得到 a,b a , b 的值,进而,当给出一个自变量(特征)时,我们就可以预测出对应的因变量(标签)。
可以然而在实际的使用过程中,会出现以下的问题:
- 特征值不唯一
- 拥有的大量样本虽然呈线性关系,然而不能确定出唯一的 a,b a , b
当解决了以上两个问题之后,就可以认为一个基本的线性回归模型建立完成了(其实,在其他更加复杂的监督学习模型中,面临的问题基本是相同的,只是解决手段更加麻烦。)
特征值不唯一的解决办法就是把多个特征组成一个特征向量,也就是在使用过程中,我们进行运算的特征不再是 x x 而是一个由