目录
理解:L1正则先验分布是Laplace分布,L2正则先验分布是Gaussian分布
理解:L1正则先验分布是Laplace分布,L2正则先验分布是Gaussian分布
理解:L1正则先验分布是Laplace分布,L2正则先验分布是Gaussian分布——复习篇_crb_day_day_up的博客-CSDN博客_拉普拉斯先验分布
为什么使用L2 norm?
参考:
深度学习下分类任务中L2 norm总结_再困也得吃的博客-CSDN博客_l2 norm
对于CNN的输出,各个特征的模长均不一样, l2 norm是强行把同个维度的特征归一化。经过L2 norm的数据都处于0到1之间,距离就变得有一个上界了,显然样本间差异