因为许多学习算法在 不同范围的特征数据中 呈现不同的学习效果。
e.g : SVM算法在没有标准化的数据集上表现比较差
波士顿房价数据集(Boston House Price Dataset)
(下载地址:http://t.cn/RfHTAgY)
使用sklearn.datasets.load_boston即可加载相关数据。该数据集是一个回归问题。每个类的观察值数量是均等的,共有 506 个观察,13 个输入变量和1个输出变量。
每条数据包含房屋以及房屋周围的详细信息。其中包含城镇犯罪率,一氧化氮浓度,住宅平均房间数,到中心区域的加权距离以及自住房平均房价等等。
from sklearn import preprocessing
import numpy as np