normalization,、standardization、regularization区别和联系

最新推荐文章于 2023-11-22 10:40:43 发布

又决定放弃

最新推荐文章于 2023-11-22 10:40:43 发布

阅读量1k

点赞数 1

分类专栏：学术垃圾的自我救赎文章标签：计算机视觉深度学习机器学习

原文链接：https://zhuanlan.zhihu.com/p/29974820

版权

学术垃圾的自我救赎专栏收录该内容

19 篇文章 4 订阅

订阅专栏

数据预处理包括normalization和standardization，旨在消除数值差异，如最大最小值归一化、对数归一化、反正切归一化和零均值归一化。它们能提升模型训练速度并改善结果。另一方面，regularization通过在成本函数中添加惩罚项，如L1和L2正则化，来防止过拟合，确保模型泛化能力。批量归一化（BN）在深度学习中显著加速训练过程，防止内部协变量漂移。

摘要由CSDN通过智能技术生成

normalization和standardization是差不多的，都是把数据进行前处理，从而使数值都落入到统一的数值范围，从而在建模过程中，各个特征量没差别对待。normalization一般是把数据限定在需要的范围，比如一般都是【0，1】，从而消除了数据量纲对建模的影响。standardization 一般是指将数据正态化，使平均值0方差为1. 因此normalization和standardization 是针对数据而言的，消除一些数值差异带来的特种重要性偏见。经过归一化的数据，能加快训练速度，促进算法的收敛。

2.而regularization是在cost function里面加惩罚项，增加建模的模糊性，从而把捕捉到的趋势从局部细微趋势，调整到整体大概趋势。虽然一定程度上的放宽了建模要求，但是能有效防止over-fitting的问题(如图，来源于网上)，增加模型准确性。因此，regularization是针对模型而言。

总结下normalization， standardization，和regularization的方法。

Normalization 和 Standardization

(1).最大最小值normalization： x’=(x-min)/(max-min). 这种方法的本质还是线性变换，简单直接。缺点就是新数据的加入，可能会因数值范围的扩大需要重新regularization。

(2). 对数归一化：x’=log10(x)/log10(xmax)或者log10(x)。推荐第一种，除以最大值，这样使数据落到【0，1】区间

(3).反正切归一化。x’=2atan(x)/pi。能把数据投影到【-1，1】区间。

(4).zero mean normalization归一化，也是standardization. x’=(x-mean)/std.

有无normalization，模型的学习曲线是不一样的，甚至会收敛结果不一样。比如在深度学习中，batch normalization有无，学习曲线对比是这样的：图一蓝色线有batch normalization （BN）,黑色虚线是没有BN. 黑色线放大，是图二的样子，蓝色线放大是图三的样子。reference:Batch Normalization: Accelerating Deep Network Training by Reducing
Internal Covariate Shift， Sergey Ioffe.

Regularization 方法

一般形式，应该是
在这里插入图片描述
,其中R是regularization term。一般方法有

L1 regularization: 对整个绝对值只和进行惩罚。
L2 regularization：对系数平方和进行惩罚。
Elastic-net 混合regularization

引自：https://zhuanlan.zhihu.com/p/29974820

又决定放弃

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录