经常可以看到归一化,标准化和正则化在机器学习中出现,下面是一个用于区分它们的简短介绍
归一化(Normalization)
归一化将特征的范围归于[0,1]区间:
如果数据没有反常值的化它会很有用,比如,在一个推荐系统中,用户打分是{1,2,3,4,5}这种有限的集合
在有些场景下,我们更喜欢使用零均值化(zero-mean)将数据映射到像[-1,1]这样的区间,然后我们可以选择均值归一化( mean normalization),这样我们就可以更方便的使用矩阵分解(matrix factorization)
标准化(Standardization)
标准化被广泛的用于很多机器学习的预处理过程中,用来将特征零均值化(zero-mean)和单位方差法(unit-variance)