1、归一化
特征的单位或者大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,通过对原始数据进行变换把数据映射到(默认为[0,1])之间
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
def minmax_demo():
"""
归一化演示
:return: None
"""
data = pd.read_csv("./data/dating.txt")
print(data)
# 1、实例化一个转换器类
transfer = MinMaxScaler(feature_range=(2, 3)) 转换到2,3之间的值,默认为[0,1]
# 2、调用fit_transform
data = transfer.fit_transform(data[['milage','Liters','Consumtime']])
print("最小值最大值归一化处理的结果:\n", data)
return None
适用范围 :最大值与最小值非常容易受异常点影响,所以归一化法鲁棒性较差,只适合传统精确小数据场景。