数据归一化(概率模型不需要)
目的:就是将数据的所有特征都映射到同一尺度上,这样可以避免由于量纲的不同使数据的某些特征形成主导作用。
优点:加快了梯度下降求最优解的速度(椭圆、圆);有可能提高精度(原始数据可能突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用)
方法:最大最小标准化(图像)、z-score标准化(数据分布近似高斯分布)、非线性归一化(数据分化比较大)如log、L2范数
目的:就是将数据的所有特征都映射到同一尺度上,这样可以避免由于量纲的不同使数据的某些特征形成主导作用。
优点:加快了梯度下降求最优解的速度(椭圆、圆);有可能提高精度(原始数据可能突出数值较高的指标在综合分析中的作用,相对削弱数值水平较低指标的作用)
方法:最大最小标准化(图像)、z-score标准化(数据分布近似高斯分布)、非线性归一化(数据分化比较大)如log、L2范数