Regularizing Neural Networks by Penalizing Confident Output Distributions (2017)摘要

最新推荐文章于 2022-09-08 17:55:39 发布

qq_41732520

最新推荐文章于 2022-09-08 17:55:39 发布

阅读量1.3k

点赞数

分类专栏：读论文文章标签： Neural and Evolutionary Computing Machine Learning

读论文专栏收录该内容

2 篇文章 0 订阅

订阅专栏

G. Pereyra, G. Tucker, J. Chorowski
原文地址
https://arxiv.org/abs/1701.06548

在深度学习的分类问题中，经常出现模型过拟合的情况，具体表现往往为：模型给一个目标分类时，给某个类过大的信任（概率）导致分类出错，（即概率集中在一个类上）。作者提出给这样的分布添加惩罚机制。

论文从条件概率的熵开始推导，y为类别，x为输入值。

将这个熵值加入似然函数，得到

Beta为该confidence penalty的惩罚力度参数。
由于模型在训练中需要同时保证在开始时尽量快的拟合和最后避免过拟合，所以需要在上式中添加阀值，使训练初期模型不会因受到penalty的影响而拟合失败。

Tao即熵的阀值。

作者进一步添加了label smoothing，假设预设的标签是均匀分布的，那么label smoothing可以简化为在均匀分布u和模型预测的标签分布p之间的KL divergence（相对熵，用于测量两个概率分布之间的区别）。

将相对熵反转的话，confidence penalty可被恢复。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Regularizing Neural Networks by Penalizing Confident Output Distributions (2017)摘要

G. Pereyra, G. Tucker, J. Chorowski原文地址https://arxiv.org/abs/1701.06548在深度学习的分类问题中，经常出现模型过拟合的情况，具体表现往往为：模型给一个目标分类时，给某个类过大的信任（概率）导致分类出错，（即概率集中在一个类上）。作者提出给这样的分布添加惩罚机制。论文从条件概率的熵开始推导，y为类别，x为输入值。将这个熵...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。