1、归一化
把数据映射到0-1范围内,使得处理过程更加便捷;提高不同数据特征之间的可比性,比如假设有身高,体重两个特征,此时假设用KNN算法计算其欧氏距离的话,可以先考虑将其归一化处理,这样比较更加便捷与科学。
2、标准化
是为了方便数据的下一步处理,而进行的数据缩放等变换,并不是为了方便与其他数据一同处理或比较,比如数据经过0-1均值标准化后,更利于使用标准正太分布的性质,进行处理;
3、正则化
正则化一般是用于防止模型出现过拟合的现象
正则化项是用来对模型中某些参数进行约束
其中,第一项是损失函数(经验风险),第二项是正则化项,lamda>=0,是调整损失函数和正则化项的系数。
详见:https://blog.csdn.net/m0_37952909/article/details/79686573