【学习笔记】稀疏性正则化(l1正则化)

还记得我们之前用经度和纬度来进行分箱吗? 仅仅是2个特征进行分箱组合就让我们的输入特征数量暴增。假设我们现在有k个特征需要来分箱,每个分为长度为k的独热编码。那么我们输入特征就为 k^k个,这种指数增长会占用我们大量ram。这是我们需要办法来拯救我们的ram。那么一个好的方法就是让我们的部分权重为0,正好为0的权重会使相应特征从模型中移除。会节省我们的ram同时也会降低我们模型中的噪点。

很遗憾的是我们之前使用的l2正则化并不能解决这个问题,l2正则化会让我们权重降低,但并不会让权重降为0。

这里l0正则化会让我们的问题变成非凸问题,这里我们用l1正则化(Lasso regression)来代替l0正则化,它具有凸优化的优势,方便我们计算。(顺便一提l2正则化又叫岭回归Ridge regression) (在tf中,l2正则化会除以2),比如:

x = tf.constant([3.0, 4.0])

sess = tf.Session()

print(sess.run(tf.contrib.layers.l2_regularizer(1.0)(x)))

>>>12.5

 

l1和l2降低权重的方法:

l1降低是权重的绝对值

l2降低权重的平方

 

因此l1和l2具有不同的导数(微分):

l1 的导数为k(一个常数,与权重无关).

l2的导数为 2*权重.

 

文章这里给了一个易懂的解释:

 我们可以把 l1正则化相当于每次对weights减去一个常数,并且由于在0处具有不连续性,出现负数则会变为0.

l2则是每次移除weights的x%,所以不会得到0。

 

下一次我们将会用独热编码来处理

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在深度学习中,正则化是一种应对过拟合问题的技术。过拟合指的是模型在训练集上表现很好,但是在测试集上表现较差的情况。为了解决这个问题,我们可以使用正则化技术。 吴恩达在深度学习中提出了两种常见的正则化技术:L2正则化和dropout正则化。L2正则化通过在损失函数中加入正则化项来约束模型的参数,使得模型的复杂度减小。这样可以减少模型对训练数据的过拟合程度,提高模型的泛化能力。具体来说,L2正则化会将模型的权重与其平方的和相乘,并添加到损失函数中。 而dropout正则化则是在训练的过程中随机地将一些神经元的输出置为0,这样可以减少神经元之间的依赖关系,降低模型过拟合的风险。在测试阶段,所有神经元的输出都会被保留,并乘以一个保留概率。 通过使用这两种正则化技术,我们可以有效地减少模型的过拟合问题,提高模型在测试集上的准确率。吴恩达在他的课程中提供了相应的代码示例和数据集,可以帮助学习者理解和实践正则化技术。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [吴恩达深度神经网络调优笔记正则化](https://blog.csdn.net/m0_51447279/article/details/127112009)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [吴恩达深度学习第二门课第一周作业](https://download.csdn.net/download/weixin_42149550/11666926)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值