线性回归模型，含线性回归的定义、推导过程、python代码实现以及结果展示。非常详细的线性回归模型解释

最新推荐文章于 2024-06-10 11:07:09 发布

hrDJP

最新推荐文章于 2024-06-10 11:07:09 发布

阅读量818

点赞数 17

文章标签： python 数学建模 scipy 线性回归线性代数人工智能大数据

本文链接：https://blog.csdn.net/hrDJP/article/details/139352429

版权

一：线性回归简介

依据自变量的数量分为一元线性回归和多元线性回归。

$Y = a*X +b+\varepsilon$

$Y =a _{1}*X_{1} +a_{2}*X_{2}+\cdot \cdot \cdot +a_{n}*X_{n}+b+\varepsilon$

其中：

$Y$ ：是因变量（要预测的变量）

$X_{i}$ ：是自变量，它表示的是不同维度的变量值。（用来预测因变量的变量）

$b$ ：是截距

$a _{i}$ ：是不同维度自变量的系数（斜率）

$\varepsilon$ ：是误差项，表示模型无法解释的部分

二：一元线性回归模型

1、推导过程

已知一组数据 $X = \begin{pmatrix} x_{1},x_{2}\cdot \cdot \cdot x_{n} \end{pmatrix}^{T}$ 和 $Y_{R} = \begin{pmatrix} y_{1},y_{2}\cdot \cdot \cdot y_{n} \end{pmatrix}^{T}$ ,由回归的定义可知，目的是要找到一个回归方程： $Y = a*X+b$ ，使得 $a*x_{i}+b$ 计算得到的 $y_{i}$ 尽可能接近真实数据 $y_{Ri}$ 。

一元方程组： $Y= a*X+b$ ，其中Y,X是向量

$\left\{\begin{matrix} y_{1} = a*x_{1}+b& & \\ y_{2} = a*x_{2}+b& & \\ \cdot & & \\ \cdot & & \\ \cdot & & \\ y_{n} = a*x_{n}+b& & \end{matrix}\right.$ $\begin{bmatrix} y_{1}\\ y_{2}\\ \cdot \\ \cdot \\ \cdot \\ y_{n}\\ \end{bmatrix}=a*\begin{bmatrix} x_{1}\\ x_{2}\\ \cdot \\ \cdot \\ \cdot \\ x_{n}\\ \end{bmatrix} + b=\begin{bmatrix} x_{1}&1\\ x_{2}&1\\ \cdot&\cdot \\ \cdot &\cdot \\ \cdot&\cdot \\ x_{n}&1\\ \end{bmatrix} *\begin{bmatrix} a\\b \end{bmatrix}$

则令 $X =\begin{bmatrix} x_{1}&1\\ x_{2}&1\\ \cdot&\cdot \\ \cdot &\cdot \\ \cdot&\cdot \\ x_{n}&1\\ \end{bmatrix}$ , $A = \begin{bmatrix} a\\b \end{bmatrix}$

变形后的公式为： $Y = X*A$ 注意此时的X是n*2维向量，A是2*1维向量。

定义残差e：

$e = Y_{R} - Y=Y_{R} - X*A$ , $e$ 是n*1维向量。只有当 $\sum \left | e_{i} \right |$ 的值最小时，回归方程求的Y与真实值 $Y_{R}$ 之间的误差最小。求 $\sum e_{i}^{2}$ 最小。

残差平方和：定义为残差的L2范数的平方 $\sum e_{i}^{2}$ 。该方法也成为最小二乘法。

$RSS\left ( A \right ) = \sum e_{i}^{2} = e^{2} = e^{T}*e=\left \| Y_{R} - X*A \right \|^{2}_{2}=\left ( Y_{R} - X*A \right )^{T}*\left ( Y_{R} - X*A \right )$

展开可以得到：

$RSS(A) =X^{T}Y-A^{T}X^{T}Y-Y^{T}XA+A^{T}X^{T}XA$

由于 $A^{T}*X^{T}*Y$ 得到的是1*1的向量，所以

$A^{T}X^{T}Y = \left ( A^{T}X^{T}Y \right )^{T} =Y^{T}XA$

则可得到： $RSS(A) =X^{T}Y-2A^{T}X^{T}Y+A^{T}X^{T}XA$

要求一个A，使得残差平方和最小，由极值点求法知道，当 $\frac{\partial RSS(A)}{\partial A}=0$ 时，RSS(A)取得最小值。

$\boldsymbol{\mathbf{\mathbf{}\frac{\partial RSS(A)}{\partial A}=-2X^{T}Y+2X^{T}XA}}$

对 $2A^{T}X^{T}Y$ 求导要用到： $\frac{d_{X^{T}}}{d_{X}} = 1$ $\frac{d_{\left ( AX \right )^{T}}}{d_{X}} = A^{T}$

对 $A^{T}X^{T}XA$ 求导数要用到该公式： $\frac{d_{\left ( U^{T}V \right )}}{d_{X}} =\frac{d_{\left ( U^{T} \right )}}{d_{X}}*V+\frac{d_{\left ( V^{T} \right )}}{d_{X}}*U$

当 $\frac{\partial RSS(A)}{\partial A} = 0$ 时，可得 $X^{T}XA =X^{T}Y$ ，该方程也被称作正规方程

如果 $X^{T}X$ 可逆，则最优解： $A =\left ( X^{T}X \right )^{-1}*X^{T}Y$

如果 $X^{T}X$ 不可逆，说明方程组中存在两个以上的方程成线性关系（成比例）。这时候我们应该用其他方式求线性回归的解。在此先不做讨论。

2、代码展示

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
# 生成随机数据.相同的种子生成的数据是一样的。
np.random.seed(0)
#rand(100,1)生成形状为100*1的大小在[0，1）之间的数据.100行1列。
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

# 向 X 添加偏置项。np.c_[]:对两个矩阵按列合并。
# np.ones(100,1)：也是100行1列全为1的矩阵。
#合并后就是100*2的矩阵。由于1的列矩阵是在前面，所以求解出来第一个参数是B，第二个才是A
X_b = np.c_[np.ones((100, 1)), X]  # 在 X 矩阵中添加一列1
# 使用 NumPy 。先求x转置*x的逆，再乘x的转置，再乘y，即最优解A。
theta_best = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y)
# 输出拟合的参数
print("拟合的参数：", theta_best)

# 进行预测。两个点：一个0点，一个2.
X_new = np.array([[0], [2]])
X_new_b = np.c_[np.ones((2, 1)), X_new]  # 在 X_new 矩阵中添加一列1
y_predict = X_new_b.dot(theta_best)
print("预测值：", y_predict)

# # 绘制数据和拟合直线
plt.plot(X, y, "b.")
plt.plot(X_new, y_predict, "r-")
plt.axis([0, 2, 0, 15])
plt.show()

三：多元回归模型

1、推导过程

多元方程： $Y= a_{1}*X_{1}+a_{2}X_{2}+\cdot \cdot \cdot +a_{p}*X_{p}+B$ ，其中Y,X,B是向量

$\left\{\begin{matrix} y_{1} = a_{1}*x_{11}+a_{2}*x_{12}+\cdot \cdot \cdot +a_{p}*x_{1p}+b_{1}+b_{2}+\cdot \cdot+b_{p}& & \\ y_{2} = a_{1}*x_{21}+a_{2}*x_{22}+\cdot \cdot \cdot +a_{p}*x_{2p}+b_{1}+b_{2}+\cdot \cdot+b_{p}& & \\ \cdot & & \\ \cdot & & \\ \cdot & & \\ y_{n} = a_{2}*x_{n1}+a_{2}*x_{n2}+\cdot \cdot \cdot +ax_{p}*x_{np}+b_{1}+b_{2}+\cdot \cdot+b_{p}& & \end{matrix}\right.$

$\begin{bmatrix} y_{1}\\ y_{2}\\ \cdot \\ \cdot \\ \cdot \\ y_{n}\\ \end{bmatrix}=a_{1}*\begin{bmatrix} x_{11}\\ x_{21}\\ \cdot \\ \cdot \\ \cdot \\ x_{n1}\\ \end{bmatrix}+a_{2}*\begin{bmatrix} x_{12}\\ x_{22}\\ \cdot \\ \cdot \\ \cdot \\ x_{n2}\\ \end{bmatrix}+\cdot \cdot \cdot +a_{p}*\begin{bmatrix} x_{1p}\\ x_{2p}\\ \cdot \\ \cdot \\ \cdot \\ x_{np}\\ \end{bmatrix}+1*\begin{bmatrix} b\\ b\\ b\\ b\\ b\\ \end{bmatrix}$

$\begin{bmatrix} y_{1}\\ y_{2}\\ \cdot \\ \cdot \\ \cdot \\ y_{n}\\ \end{bmatrix}=\begin{bmatrix} x_{11}&x_{12}&\cdot \cdot \cdot &x_{1p}&1\\ x_{21}&x_{22}&\cdot \cdot \cdot &x_{2p}&1\\ \cdot \\ \cdot \\ \cdot \\ x_{n1}&x_{n2}&\cdot \cdot \cdot &x_{np}&1\\ \end{bmatrix}*\begin{bmatrix} a_{1}\\ a_{2}\\ \cdot \\ \cdot \\ \cdot \\ a_{p}\\ b \end{bmatrix}$

则令 $X=\begin{bmatrix} x_{11}&x_{12}&\cdot \cdot \cdot &x_{1p}&1\\ x_{21}&x_{22}&\cdot \cdot \cdot &x_{2p}&1\\ \cdot \\ \cdot \\ \cdot \\ x_{n1}&x_{n2}&\cdot \cdot \cdot &x_{np}&1\\ \end{bmatrix}$ $A = \begin{bmatrix} a_{1}\\ a_{2}\\ \cdot \\ \cdot \\ \cdot \\ a_{p}\\ b \end{bmatrix}$

变形后的公式为： $Y = X*A$ 注意此时的X是n*p维向量，A是p*1维向量。后面的推导与一元的函数一样。有线性代数基础应该很容易看懂。下面代码展示的是使用 scikit-learn库中的线性回归模型进行回归预测。模型库封装更加完善，推荐使用库中的方法，特别是当 $X^{T}X$ 不可逆时，库中有解决方案。sklearn.linear_model.LinearRegression()

2、代码展示

import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression

# 生成随机数据.相同的种子生成的数据是一样的。
np.random.seed(0)
#rand(100,1)生成形状为100*1的大小在[0，1）之间的数据.100行1列。
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

# 使用 scikit-learn 进行线性回归
lin_reg = LinearRegression()
lin_reg.fit(X, y)

# 输出拟合的参数
print("截距：", lin_reg.intercept_)
print("斜率：", lin_reg.coef_)

# 进行预测。两个点：一个0点，一个2.
X_new = np.array([[0], [2]])
X_new_b = np.c_[np.ones((2, 1)), X_new]  # 在 X_new 矩阵中添加一列1
print("预测值：", lin_reg.predict(X_new))

# 绘制数据和拟合直线
plt.plot(X, y, "b.")
plt.plot(X_new, lin_reg.predict(X_new), "r-")
plt.axis([0, 2, 0, 15])
plt.show()

四：结果展示

hrDJP

关注

17
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
线性回归模型，含线性回归的定义、推导过程、python代码实现以及结果展示。非常详细的线性回归模型解释

文章主要介绍线性回归模型的原理以及推导过程，使用sklearn.linear_model.LinearRegression()实现并含python代码，
复制链接

扫一扫