所谓“归一”,注意“一”,就是把数据归到(0,1)这个区间内。
常用的方法有: min-max归一化y=(x-min)/(max-min)
所谓“标准”,就是标准正态分布,把数据转换成标准正态分布。
常用的方法有:z-score标准化,即零-均值标准化,y=(x-μ)/σ
两者的区别在于:
归一化是为了消除不同数据之间的量纲,方便数据比较和共同处理,比如在神经网络中,归一化可以加快训练网络的收敛性;标准化是为了方便数据的下一步处理,而进行的数据缩放等变换,并不是为了方便与其他数据一同处理或比较,比如数据经过零-均值标准化后,更利于使用标准正态分布的性质,进行处理