特征工程目的:
降维/降低过拟合/泛化、解释性、加快训练速度、性能
特征工程框图:
- 数据预处理
无量纲化:转化不同规格的特征到同一规格
(1)标准化/z标准化
将符合正态分布的特征值转化为标准正态分布
使用sklearn.preproccessing库的StandardScaler类
(2)区间缩放法/线性归一化/0-1标准化
返回缩放到[0,1]区间的数据
使用sklearn.preproccessing库的MinMaxScaler类
(
特征工程目的:
降维/降低过拟合/泛化、解释性、加快训练速度、性能
特征工程框图:
无量纲化:转化不同规格的特征到同一规格
(1)标准化/z标准化
将符合正态分布的特征值转化为标准正态分布
使用sklearn.preproccessing库的StandardScaler类
(2)区间缩放法/线性归一化/0-1标准化
返回缩放到[0,1]区间的数据
使用sklearn.preproccessing库的MinMaxScaler类
(