scikit-learning 多项式回归应用房价预测

将sklearn.datasets中的load_boston房价数据用多项式回归进行训练,并画出学习曲线

import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline
from common.utils import plot_learning_curve
from sklearn.model_selection import ShuffleSplit

def get_bosten_houst_price_train_test_data():
    bosten_houst_price_data = load_boston()
    x = bosten_houst_price_data.data
    y = bosten_houst_price_data.target
    print(bosten_houst_price_data.feature_names)
    #print(x)
    print(x.shape)
    x_train
  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: scikit-learn是一个流行的Python机器学习库,它包含了许多用于数据挖掘和数据分析的工具。其中,线性回归是一种常见的机器学习算法,用于预测一个连续的输出变量。在这个实践中,我们将使用scikit-learn来实现波士顿房价预测,这是一个经典的回归问题。我们将使用波士顿房价数据集,该数据集包含了506个样本和13个特征,我们将使用这些特征来预测房价。我们将使用scikit-learn的线性回归模型来训练我们的模型,并使用测试数据集来评估模型的性能。最后,我们将使用模型来预测新的房价。 ### 回答2: Scikit-learn是一个开源机器学习库,提供了丰富的工具和算法,能够方便地进行数据挖掘、数据分析和机器学习任务。其中,线性回归是最经典的机器学习算法之一,可用于建立模型并预测实际数值。本文将介绍如何使用Scikit-learn进行线性回归实践,以波士顿房价预测为例。 首先,我们需要导入相关的库,包括numpy、pandas和matplotlib等。随后,我们需要加载数据集,这里使用Scikit-learn自带的波士顿房价数据集。该数据集包含506个样本和13个特征,其中每个特征都代表了房屋的一些属性,比如犯罪率、公路可达性、房屋年龄等。我们需要将其分为训练集和测试集,通常采用80:20的比例。 接下来,我们需要构建线性回归模型并进行训练。对于Scikit-learn库中的线性回归模型来说,我们只需调用LinearRegression函数即可,它自动帮我们进行拟合和求解。在进行训练之前,我们需要先对数据进行标准化处理,以便提高模型的准确性和稳定性。 一旦模型训练完成,我们可以使用测试集对其进行评估。在这里,我们可以利用Scikit-learn提供的评估函数,例如均方误差(MSE)、均方根误差(RMSE)和决定系数(R2),以判断模型的准确性和泛化能力。通常情况下,我们希望模型在测试集上的表现要尽可能接近于训练集。 最后,我们可以利用训练好的模型对新数据进行预测,这里我们可以设置几个自定义的房屋参数,包括犯罪率、公路可达性、房屋年龄等,然后用模型对这些参数进行预测,以预测新房屋的价格。 总之,Scikit-learn在机器学习和数据科学领域有着广泛的应用,尤其对于线性回归等传统机器学习算法的应用非常丰富,并且使用起来非常简单、方便。波士顿房价预测是一个入门级别的机器学习项目,对于初学者来说,非常适合用来熟悉Scikit-learn使用方法和建模流程。 ### 回答3: 线性回归是机器学习中最常用的方式之一,而波士顿房价数据集是一个我们可以应用线性回归的经典案例。对于一个人们以及公司都乐意了解波士顿地区的房价趋势的问题来说,这个数据集非常有意义。scikit-learn是一个机器学习库,这里我们将介绍如何使用scikit-learn来预测波士顿房价。 在使用scikit-learn解决线性回归问题时,首先要解决的是如何将数据集分为训练集和测试集。这个步骤可以使用train_test_split函数,它将数据集随机划分成训练集和测试集。我们通常将80%的数据划分为训练集,剩下的20%划分为测试集。 接下来,我们需要创建模型并将其拟合到训练数据上。scikit-learn的线性回归模型是LinearRegression,我们可以直接使用它。我们创建模型的方式非常简单,只需要用LinearRegression()构造函数实例化一个对象即可。然后,我们在训练集上使用fit()方法来拟合模型。 一旦拟合完成,我们就可以对测试数据进行预测了。我们使用predict()方法来实现这个过程,并将结果存入变量y_pred中。 最后,我们可以通过比较预测结果和实际结果来评估模型表现。这里我们使用mean_squared_error函数来计算均方差。均方差越小表明模型的预测结果越接近真实结果,说明模型的表现越好。 在波士顿房价预测任务中,线性回归表现良好。通过这个例子,不仅可以学习如何使用scikit-learn实现线性回归,还可以了解如何评估模型。在真实任务中,我们还可以将特征工程和模型调优结合起来,提高模型的预测能力和泛化能力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值