2-3. 超参数调试、Batch正则化和程序框架

1. 调试处理

    以两个待调试参数为例,我们可以在一个二维平面内随机取点,并将每个点都试一遍,找出某几个表现出众的点。再在它们所围成的区域里随机取点,重复上述过程,直至找到满意的取值。
    若是多个参数,可以类比,只不过是在一个更高维度的空间中取点罢了。
    之所以要随机取点而不是等间距取点,是因为如果其中有一个参数对结果影响不大,那么随机取点可以让我们对另一个参数尝试更多的可能性。
    仍以两个参数为例。如果我们在一个二维平面内等间距取25个点( 5×5 5 × 5 ),并且其中有一个参数 ϵ ϵ 对结果的影响微乎其微,那么我们对另一个参数的取值实际上只取了5个值。而如果是随机取点的话,我们对另一个参数则去了25个值,更有可能找到最优解。

2. 为超参数选择合适的范围

    当我们估计出某个超参数大致的范围后,我们希望的是能够在这个范围内随机 均匀取值。例如我们想要决定某一层的神经元个数 n[l] n [ l ] ,我们可能会在 (50, 100) ( 50 ,   100 ) 这个区间内去随机均匀取值,这是没有问题的。
    但是如果我们想要调整超参数 β β ,我们很有可能会在 (0.0001, 1) ( 0.0001 ,   1 ) 的范围内去随机取值。这是再在区间内随机取值就不行了。因为这时我们会在 (0.1, 1) ( 0.1 ,   1 ) 间分配 90% 90 % 的点,而在 (0.0001, 1) ( 0.0001 ,   1 ) 内分配 10% 10 % 的点。这样显然不行。
  这种情况下我们可以对它取对数( log10β log 10 ⁡ β 。这样就变成了在 (4, 0) ( − 4 ,   0 ) 里面随机取值。同样,如果 β β (0.9, 0.9999) ( 0.9 ,   0.9999 ) 中取值,那么我们可以对 1β 1 − β 取对数,然后再随机取值。
    此外我们还需注意的一点是,对于想 β β 这样的超参数,它的灵敏度会随着区间的变化而变化。当 β β 趋向于1时,其灵敏度会大幅上升,所以我们对于这样的区间要更加密集地取点。

3. 超参数的训练的实践: Pandas VS Caviar P a n d a s   V S   C a v i a r

  • Pandas P a n d a s : 当我们有足够多的数据但没有足够强的 CPU/GPU C P U / G P U 时,我们可以只关注一个模型,并且每天都根据它的表现来不断修改参数。
  • Caviar C a v i a r : 如果我们有非常强大的 CPU/GPU C P U / G P U 的话,那么我们可以同时训练多个模型,根据它们的曲线来选择最优方案。

4. 正则化网络的激活函数

Batch Norm B a t c h   N o r m 这个地方一直没弄明白,怎么看 z˜(i) z ~ ( i ) 都不等于 z(i) z ( i ) 啊。

μ=1miz(i)σ2=1mi(z(i)μ)2z(i)norm=z(i)μσ2ϵz˜(i)=γz(i)norm+βγβ(learnable parameters)If:{γ=σ2+ϵβ=μ              Then:z˜(i)=z(i)(1) (1) { μ = 1 m ∑ i z ( i ) σ 2 = 1 m ∑ i ( z ( i ) − μ ) 2 z n o r m ( i ) = z ( i ) − μ σ 2 ⋅ ϵ z ~ ( i ) = γ ⋅ z n o r m ( i ) + β ⏟ γ 、 β 是 我 们 的 模 型 的 学 习 参 数 ( l e a r n a b l e   p a r a m e t e r s ) I f : { γ = σ 2 + ϵ β = μ                             T h e n : z ~ ( i ) = z ( i )

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值