平时日常的生活工作中,会产生一些数据集,这些数据或是关于时间的变量(基于时间的序列),或者是关于多个自变量(由多个因素影响)的多元函数。在数学上为了建立能较为准确地描述这种函数关系的模型。往往会用到一种较为直观的方法,即图表法,即绘制出自变量
的图。
1.理论
1.1最小二乘法
首先,这个式子就是最小二乘法的数学表达,这个式子的
表示我们选取的模型得到的y的预测值,
则是真实值。使得所有的两者之差的平方和最小,即可认为是所有预测值偏离真实值的程度最小。(事实上可证明最小二乘法得到的是真实值的无偏估计,但是方差并不一定是最小的,还有很多优化的措施)
1.2多元线性回归
本文旨在介绍一下拟合未知数据集曲线的一种方法,即最小二乘法。由于线性回归是大多数非线性回归的基础,先从线性回归讲起。或许在以前大家知道最小二乘法在拟合一元线性方程(即
)的应用。那时得出来的公式如下:
但是总的来说这个公式不具备普适性,比如y要是和x1还有x2都有关联(即
),这个公式就不适用了。接下来推导最小二乘法下的多元线性回归公式,(涉及高等数学和线性代数)