Deep learning II - I Practical aspects of deep learning - Regularizing your neural network 神经网络范数正则化

最新推荐文章于 2021-06-18 22:07:49 发布

dqhl1990

最新推荐文章于 2021-06-18 22:07:49 发布

阅读量202

点赞数

分类专栏：深度学习算法 deep learning 文章标签：正则化

算法同时被 3 个专栏收录

34 篇文章 4 订阅

订阅专栏

深度学习

29 篇文章 1 订阅

订阅专栏

deep learning

29 篇文章 1 订阅

订阅专栏

Regularizing your neural network 神经网络正则化

Logistic regression regularization

先用简单的逻辑回归正则化作为例子，因为神经网络的参数 $W$ 是2维的。

无正则

$J (w, b) = \frac{1}{m} \sum_{i = 1}^{m} L ({\hat{y}}^{(i)} - y^{(i)})$
- $L_2$ 正则
  
  $J (w, b) = 1 m \sum i = 1 m L (y^(i) - y (i)) + λ 2 m | | w | | 22$ $J(w,b) = \frac{1}{m} \sum_{i=1}^{m} {\cal L}(\hat{y}^{(i)} - y^{(i)}) + \frac{\lambda}{2m}||w||^2_2$
  $| | w | | 22 = \sum j = 1 n x w 2 j = w T w$ $||w||^2_2 = \sum_{j=1}^{n_x}w_j^2 = w^Tw$
- $L_1$ 正则
  $J (w, b) = 1 m \sum i = 1 m L (y^(i) - y (i)) + λ m | | w | | 1$ $J(w,b) = \frac{1}{m} \sum_{i=1}^{m} {\cal L}(\hat{y}^{(i)} - y^{(i)}) + \frac{\lambda}{m}||w||_1$
- ||w||1=∑j=1nx|w|j
  
  Neural network regularization
  1. Frobenius正则(类似 $L_2$ 正则)
    $J (w [1], b [1], \dots, w [l], b [l]) = 1 m \sum i = 1 m L (y^(i), y (i)) + 1 2 m \sum l = 1 L | | w [l] | | 2 F$ $J(w^{[1]},b^{[1]}, \cdots , w^{[l]},b^{[l]}) = \frac{1}{m} \sum_{i =1}^m {\cal L}(\hat{y}^{(i)}, y^{(i)}) + \frac{1}{2m} \sum_{l=1}^L ||w^{[l]}||_F^2$
    $| | w [l] | | 2 F = \sum i = 1 n [l] \sum j = 1 n [l - 1] (w [l] i j) 2$ $||w^{[l]}||_F^2 = \sum_{i = 1}^{n^{[l]}} \sum_{j = 1}^{n^{[l-1]}}(w^{[l]}_{ij})^2$
  相较于无正则化的反向传播，正则化的反向传播在更新 $W$ 时，会对其进行权重衰减（weight decay），并下降。
  
  $d w^{[l]} = (f r o m b a c k p r o p a g a t i o n) + \frac{λ}{m} w^{[l]}$
  
  w[l]:=w[l]−αdw[l]=w[l]−αλmw[l]−α(from backpropagation)=(1−αλm)w[l]−α(from backpropagation)
  $\begin{split}w^{[l]}: &=w^{[l]} - \alpha {\rm d}w^{[l]} \\&= w^{[l]} - \alpha \frac{\lambda}{m}w^{[l]} - \alpha (from\ backpropagation) \\&= (1- \alpha \frac{\lambda}{m})w^{[l]} - \alpha (from\ backpropagation)\end{split}$

dqhl1990

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Deep learning II - I Practical aspects of deep learning - Regularizing your neural network 神经网络范数正则化

Regularizing your neural network 神经网络正则化Logistic regression regularization先用简单的逻辑回归正则化作为例子，因为神经网络的参数WWW是2维的。无正则 J(w,b)=1m∑i=1mL(y^(i)−y(i))J(w,b)=1m∑i=1mL(y^(i)−y(i))J(w,b) = \frac{1}{m} \...
复制链接

扫一扫