线性回归（Linear Regression）

renshengbushexie

于 2024-07-16 23:14:11 发布

阅读量267

点赞数 7

文章标签：线性回归人工智能机器学习

本文链接：https://blog.csdn.net/qq_44133607/article/details/140479326

版权

1. 理论知识

线性回归是一种基本且广泛使用的监督学习算法，用于建立自变量（特征）和因变量（目标）之间的线性关系。目标是找到一条最佳拟合线，使得数据点到该线的距离最小化。

数学模型

目标函数

参数解读

实施步骤

数据准备：
- 收集数据。
- 将数据分为训练集和测试集。
数据预处理：
- 处理缺失值。
- 数据标准化或归一化（视情况而定）。
建立模型：
- 使用训练数据拟合线性回归模型。
模型评估：
- 使用测试数据评估模型性能。
- 计算 $R^{2}$ 、均方误差（MSE）等指标。
预测：
- 使用训练好的模型进行预测。

线性回归的Python实现

import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# 生成示例数据
np.random.seed(0)
X = 2 * np.random.rand(100, 1)
y = 4 + 3 * X + np.random.randn(100, 1)

# 数据分割为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建线性回归模型
lin_reg = LinearRegression()
lin_reg.fit(X_train, y_train)

# 进行预测
y_pred = lin_reg.predict(X_test)

# 模型评估
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

print(f"Mean Squared Error: {mse}")
print(f"R^2 Score: {r2}")
print(f"Intercept: {lin_reg.intercept_}")
print(f"Coefficient: {lin_reg.coef_}")

# 可视化结果
plt.scatter(X_test, y_test, color='blue')
plt.plot(X_test, y_pred, color='red', linewidth=2)
plt.xlabel("X")
plt.ylabel("y")
plt.title("Linear Regression")
plt.show()