首先,特征的预处理主要有以下方式:
1、异常值和缺失值检测处理
2、归一化,不同自变量之间的数据范围不一致,导致比较复杂,两个维度范围相差的越大,梯度下降的越慢,还可能永远无法收敛,利用归一化加快收敛的速度。
归一化的方式
x-min/max-min
z-score=x–μ/σ
首先,特征的预处理主要有以下方式:
1、异常值和缺失值检测处理
2、归一化,不同自变量之间的数据范围不一致,导致比较复杂,两个维度范围相差的越大,梯度下降的越慢,还可能永远无法收敛,利用归一化加快收敛的速度。
归一化的方式
x-min/max-min
z-score=x–μ/σ