数据归一化
导语
在机器学习入门的过程中,我们经常见到在导入数据时,常常出现的一步操作叫做数据归一化(normalization),一开始我并不知道它的作用,甚至发现有些时候去掉数据归一化的步骤,代码一样可以运行,机器学习的结果甚至也是正确的,所以去调查了一番,什么是数据归一化,又到底是做什么的。
一、为什么要进行数据归一化
我们先观察下面的两个图像。
要找到他们的梯度方向。如下图所示
很显然是左侧的图像更容易去找,换作是机器学习之中,这一组数据更利于你的程序快速收敛。
往往我们需要进行学习和训练的一手数据都比较粗糙,大多都有着不同甚至是相差很大的量纲,这样就会出现右图中图