线性回归(Linear Regression)是统计分析、机器学习中最基础也是最重要的算法之一,利用线性函数对一个或多个自变量和因变量(y)之间的关系进行拟合模型,用来做预测。
根据自变量(样本特征)个数分为一元和多元线性回归:
$$
Y=a + bx
$$
$$
Y = a+ b1X1 + b2X2 + b3X3 + ... + bkXk
$$
开胃小菜
什么是线性?
首先看看线性函数的定义:一阶或零阶多项式。特征是一维时,线性模型在二维空间构成一条直线;特征是二维时,线性模型在三维空间中构成一个平面;特征是三维时,则最终模型在四维空间中构成一个体;以此类推…
线性回归具体什么时候使用呢?
回归问题,因变量是连续值
自变量和因变量存在线性关系
其实,这里我们可以大概将线性回归概括为:在N维空间中找到一个线性函数(一条直线,一个平面...)来拟合数据。
看图更直观一些: