机器学习——数据的标准化
神经网络在处理数据,建立模型时候如果不进行标准化(归一化)会导致误差特别大,而且神经网络的输出值通常介于[-1, 1]。当你想让神经网络输出在[0,255]这种自定义的区间内,那么在神经网络训练的初期会变得极其不稳定。
所以需要对数据进行标准化(归一化),那么输出结果就可以进行反标准化(归一化),就是数学推导将标准化结果反过来即可。
标准化可分成三种:
-
对标签值和特征值一起标准化
-
对标签值标准化,特征值不变
-
对标签值和特征值分别进行标准化(两类数据标准化使用方法可以不同)
标准化方法:
- 最大-最小标准化
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/58ea7fa6eba909fe8ebf0a5d10387e83.jpeg)
- Z-score标准化
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/5344d19785b2060bbb8337beee691cd5.jpeg)
- 函数转换