任务描述
本关任务:你需要调用
sklearn
中的线性回归模型,并通过波斯顿房价数据集中房价的13
种属性与目标房价对线性回归模型进行训练。我们会调用你训练好的线性回归模型,来对房价进行预测。相关知识
为了完成本关任务,你需要掌握:1.
LinearRegression
。数据集介绍
波斯顿房价数据集共有
506
条波斯顿房价的数据,每条数据包括对指定房屋的13
项数值型特征和目标房价组成。用数据集的80%
作为训练集,数据集的20%
作为测试集,训练集和测试集中都包括特征和目标房价。 想要使用该数据集可以使用如下代码:
import pandas as pd
#获取训练数据
train_data = pd.read_csv('./step3/train_data.csv')
#获取训练标签
train_label = pd.read_csv('./step3/train_label.csv')
train_label = train_label['target']
#获取测试数据
test_data = pd.read_csv('./step3/test_data.csv')
LinearRegression
LinearRegression
的构造函数中有两个常用的参数可以设置:
fit_intercept
:是否有截据,如果没有则直线过原点,默认为Ture
。normalize
:是否将数据归一化,默认为False
。
LinearRegression
类中的fit
函数用于训练模型,fit
函数有两个向量输入:
X
:大小为**[样本数量,特征数量]**的ndarray
,存放训练样本Y
:值为整型,大小为**[样本数量]**的ndarray
,存放训练样本的标签值
LinearRegression
类中的predict
函数用于预测,返回预测值,predict
函数有一个向量输入:
X
:大小为**[样本数量,特征数量]**的ndarray
,存放预测样本
LinearRegression
的使用代码如下:
lr = LinearRegression()
lr.fit(X_train, Y_train)
predict = lr.predict(X_test)
编程要求
使用
sklearn
构建线性回归模型,利用训练集数据与训练标签对模型进行训练,然后使用训练好的模型对测试集数据进行预测,并将预测结果保存到./step3/result.csv
中。保存格式如下:测试说明
我们会获取你的预测结果与真实标签对比,
R2
指标高于0.6
视为过关。#encoding=utf8 #********* Begin *********# import pandas as pd from sklearn.linear_model import LinearRegression #获取训练数据 train_data = pd.read_csv('./step3/train_data.csv') #获取训练标签 train_label = pd.read_csv('./step3/train_label.csv') train_label = train_label['target'] #获取测试数据 test_data = pd.read_csv('./step3/test_data.csv') lr = LinearRegression() #训练模型 lr.fit(train_data,train_label) #获取预测标签 predict = lr.predict(test_data) #将预测标签写入csv df = pd.DataFrame({'result':predict}) df.to_csv('./step3/result.csv', index=False) #********* End *********#
scikit-learn线性回归实践 - 波斯顿房价预测
于 2024-06-04 10:37:56 首次发布