正则化

最新推荐文章于 2018-07-09 20:48:29 发布

chengqiuming

最新推荐文章于 2018-07-09 20:48:29 发布

阅读量234

点赞数

分类专栏：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chengqiuming/article/details/80218516

版权

人工智能专栏收录该内容

91 篇文章 4 订阅

订阅专栏

一正则化概念

所谓正则化，其实就是在神经网络计算损失值的过程中，在损失后面再加一项。这样损失值所代表的输出值与标准结果间的误差就会受到干扰，导致学习参数w和b无法按照目标方向来调整，实现模型无法与样本完全拟合的结果，从而到达防止过拟合的效果。

理解原理之后，现在就来介绍如何添加这个干扰项。干扰项一定要有这样的特性：

当欠拟合时，希望它对模型误差的影响越小越好，以便让模型快速拟合实际。

如果是过拟合时，希望它对模型误差的影响越大越好，以便让模型不要产生过拟合的情况。

由此引入了两个范式L1和L2：

L1：所有学习参数w的绝对值的和，乘以λ/n。

L2：所有学习参数w的平方，除以训练集的样本大小n。

如果放到损失函数公式里，会将其变形一下：

L1：

L2：

最终的C为等式左边的结果，C0代表真实的loss值，C0后面的那一项就代表正则化了，λ为一个可以调节的参数，用来控制正则化对C0的影响。

对于L2，将其乘以 1/2是为了反向传播时对其求导正好可以将数据规整。

二 TensorFlow中的正则化

L1的正则化函数：

tf.reduce_sum(tf.abs(w))

L2的正则化函数：

tf.nn.l2_loss(t,name=None)

三参考

https://blog.csdn.net/kyang624823/article/details/78646234

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

chengqiuming CSDN认证博客专家 CSDN认证企业博客

码龄8年

6005: 原创

2万+: 周排名

169万+: 总排名

1152万+: 访问

: 等级

12万+: 积分

3718: 粉丝

3526: 获赞

1165: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

最新评论

Java实现单字段分组，多字段求和
华云之旅: bigdecimal不能为空吧？
Java实现单字段分组，多字段求和
华云之旅: 空指针异常
Activiti的附件管理实战
打工人学到啥: 我存的就是输入流了，数据库act的表也没看到有这个字段，到底存在哪里呢
Activiti的附件管理实战
打工人学到啥: Attachment createAttachment(String attachmentType, String taskId, String processInstanceId, String attachmentName, String attachmentDescription, InputStream content);存的文件在哪里
C++关于线程栈尺寸实战
hhhhhhhhhhkkkkkkkkkk: 静态数据区算是另类的堆空间，效果上相当于在main函数执行前先申请(malloc)静态数据区的空间。不随函数的退出而释放，行为与堆空间相似，区别是不能手动释放，所以也算是堆空间。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。