1.模型的概念
2.回归分析
线性回归是⼀种⽤于建模和分析两个变量之间关系的统计⽅法。在线性回归 中,我们假设两个变量之间存在线性关系,即⼀个变量的值可以通过另⼀个变量的线性组合来预测。 线性回归的基本原理是通过找到⼀条最佳拟合直线(或超平⾯,对于多维情况)来 表示两个变量之间的关系。
3.拟合
拟合,是指构建⼀种算法(数学函数),使得该算法能够符合真实的数据。从机 器学习⻆度讲,线性回归就是要构建⼀个线性函数,使得该函数与⽬标值之间的相 符性最好。从空间的⻆度来看,就是要让函数的直线(⾯),尽可能靠近空间中所 有的数据点(点到直线的平⾏于y轴的距离之和最短)。线性回归会输出⼀个连续 值。
这条直线被称为回归线,⽤来最⼩化实际观测值与线性模型预测值之间的差异。这 个差异通常⽤残差(实际值与预测值之间的差异)的平⽅和来度量,这就是所谓的 最⼩⼆乘法。
4.线性回归模型
简单线性回归
代码演示:
# 导⼊所需的库
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
# ⽣成⼀些示例数据
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)
# 创建线性回归模型
model = LinearRegression()
# 训练模型
model.fit(X, y)
# 获取模型参数
slope = model.coef_[0]
intercept = model.intercept_
# 打印模型参数
print("斜率 (Slope):", slope[0])
print("截距 (Intercept):", intercept[0])
# 绘制数据点和拟合直线
plt.scatter(X, y, color='blue')
plt.plot(X, model.predict(X), color='red', linewidth=3)
plt.xlabel(