数据介绍:
数据集来自UCI机器学习知识库(数据集已下线)。波士顿房屋这些数据于1978年开始统计,共506个数据点,涵盖了麻省波士顿不同郊区房屋14种特征的信息。本项目对原始数据集做了以下处理:
• 有16个’MEDV’ 值为50.0的数据点被移除。 这很可能是由于这些数据点包含遗失或看不到的值。
• 有1个数据点的 ‘RM’ 值为8.78. 这是一个异常值,已经被移除。
• 对于本项目,房屋的’RM’, ‘LSTAT’,'PTRATIO’以及’MEDV’特征是必要的,其余不相关特征已经被移除。
• 'MEDV’特征的值已经过必要的数学转换,可以反映35年来市场的通货膨胀效应
数据集:链接:https://pan.baidu.com/s/18kcJ66dDzHTOdOlgFghgOA 提取码:20qa
第一步:导入数据
#载入此项目所需要的库
import numpy as np
import pandas as pd
import visuals as vs # Supplementary code
#检查你的Python版本
#from sys import version_info
#if version_info.major !=3 and version_info.minor != 7:
#raise Exception('请使用Python 3.7来完成此项目')
%matplotlib inline
#载入波士顿房屋的数据集
data = pd.read_csv('housing.csv')
prices = data['