本帖ai生成可能存在错误(自用)
目录
在 Python 中,多元线性回归可以使用 scikit-learn
库来实现。以下是一个简单的示例,展示如何使用 scikit-learn
进行多元线性回归。
一、示例代码
pythonCopy Code
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
# 创建示例数据
# 假设我们有两个自变量 X1 和 X2,以及一个因变量 Y
data = {
'X1': [1, 2, 3, 4, 5],
'X2': [2, 3, 4, 5, 6],
'Y': [2, 3, 5, 7, 11]
}
df = pd.DataFrame(data)
# 特征和目标变量
X = df[['X1', 'X2']] # 自变量
#X = df[['X1', 'X2']] 是 Pandas 中的一个用法,用于从 DataFrame 中选择特定的列
y = df['Y'] # 因变量
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 创建线性回归模型
model = LinearRegression()
# 拟合模型
model.fit(X_train, y_train)
# 进行预测
y_pred = model.predict(X_test)
# 打印结果
print("Coefficients:", model.coef_)
print("Intercept:", model.intercept_)
print("Mean Squared Error:", mean_squared_error(y_test, y_pred))
print("R^2 Score:", r2_score(y_test, y_pred))
二、代码说明
-
导入库:
- 导入必要的库,包括
numpy
、pandas
、sklearn
的相关模块。
- 导入必要的库,包括
-
创建数据:
- 使用字典创建示例数据,并将其转换为 Pandas DataFrame。
-
定义特征和目标变量: