记录一下：Boston房价预测（Sklearn.LinearRegression）

myqijin

已于 2023-03-21 16:22:36 修改

阅读量103

点赞数

分类专栏： python 文章标签： sklearn python 机器学习

于 2023-03-21 14:18:26 首次发布

本文链接：https://blog.csdn.net/myqijin/article/details/129687609

版权

python 专栏收录该内容

10 篇文章 1 订阅

订阅专栏

该代码示例展示了如何使用Python的Pandas、Numpy、Matplotlib和Sklearn库进行线性回归分析。首先，它读取了一个名为housing.data的数据集，然后提取特征和标签，接着将数据划分为训练集和测试集。之后，创建了一个Pipeline来标准化数据并应用线性回归模型。模型训练后，输出了斜率和截距，并对测试集进行了预测。最后，绘制了预测结果的散点图并计算了R²得分。

摘要由CSDN通过智能技术生成

#!/usr/bin/env python
# coding: utf-8

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn import datasets
from sklearn import metrics
from sklearn.linear_model import LinearRegression,SGDRegressor,Ridge
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
fn = r'C:/Users/Administrator/Downloads/housing.data'

# 读取数据
df = pd.read_csv(fn, header=None, names=[
                 'CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'PRICE'], sep='\s+')

# 提取特征和标签
features = df.iloc[:, :-1]
label = df.iloc[:, -1]

# 切分训练集和测试集
x_train, x_test, y_train, y_test = train_test_split(
    features, label, test_size=0.2, random_state=100)

# 导入pipeline，完成正则化和线性回归
pipe = Pipeline(steps=[('sc', StandardScaler()),
                ('linearregression', LinearRegression())])

# 模型训练
pipe.fit(X=x_train, y=y_train)

# 显示斜率和截距
print(pipe.named_steps['linearregression'].coef_)
print(pipe.named_steps['linearregression'].intercept_)

# 预测
y_pred_test = pipe.predict(x_test)
y_pred_train = pipe.predict(x_train)

# 作图显示预测结果
df_test = y_test.to_frame().reset_index()
df_test_pred = pd.DataFrame(y_pred_test, columns=['PRICE_pred'])
df_test_all = df_test.join(df_test_pred)
df_test_all.drop(columns='index',inplace=True)
fig, ax = plt.subplots(figsize=(10, 6))
for co in df_test_all.columns.values:
    ax.scatter(df_test_all.index, y=df_test_all[co], label=co)
ax.legend()
plt.show()

# 显示R²
print(pipe.score(x_test, y_test))

数据集：

链接：https://pan.baidu.com/s/1_H_42vzoW7Ar0JFSX5INKg?pwd=11xb
提取码：11xb