标准化:通过对原始数据进行变换,把数据变换到均值0,标准差为1的范围内
对于归一化来说:如果出现异常点,影响了最大值和最小值,那么结果显然会发生变化
对于标准化来说:如果出现异常点,由于具有一定数量,少量的异常点对于平均值的影响并不大,从而方差改变较小。
一般而言,标准化处理数据比较常用
# encoding: utf-8
import pandas as pd
from sklearn.preprocessing import StandardScaler
D:\Python\Python36\lib\importlib\_bootstrap.py:219: RuntimeWarning: numpy.ufunc size changed, may indicate binary incompatibility. Expected 192 from C header, got 216 from PyObject
return f(*args, **kwds)
data = pd.read_table