对抗标签噪音的深度学习方法总结

最新推荐文章于 2023-06-06 20:17:31 发布

miguemath

最新推荐文章于 2023-06-06 20:17:31 发布

阅读量2.6k

点赞数 5

分类专栏：机器学习论文文章标签：深度学习噪音数据机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wangkaidehao/article/details/107709337

版权

文章目录

深度学习模型往往需要大量的标记正确的数据，而现实世界的数据集中有8%~38.5%的数据是被污染的。现在的深度学习模型很容易对存在噪音的数据集过拟合，从而使得模型在测试集上的表现较差。现在比较流行的防止模型过拟合的方法：数据增强，权重衰减，dropout, batch normalization等方法并不能很好的解决这一问题。

1 鲁棒性的损失函数

这类方法通过改编损失函数，使得模型在噪音数据集上训练后的性能与在干净的噪音数据集上的性能相当。比如分类交叉熵往往用作分类任务的损失函数，但是它本身在面对噪音数据时表现并不好。

所以有些研究者就想使用GCE, generalized cross entropy ; SCE, symmetric cross entropy来对抗噪音数据。但是这些改编的损失函数只适用于简单的情形，即任务比较简单，数据量比较少的时候。

在实做的时候，改编的损失函数往往对降低模型的性能。

2 鲁棒性的架构

这类方法中包含噪音适应层，以及用于估计噪音转移概率的专用架构。生成对抗网络也包含在这一类方法之中，我对这类方法了解有限，只知道这类方法往往难以训练而且效果并不好。

3 正则化

常用的权重衰减，dropout, batch normalization等方法足以抵抗少量噪音数据。除此之外现在预训练模型比如BERT、ELMO等也可以在一定程度上增加模型在微

最低0.47元/天解锁文章

关注

5
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
对抗标签噪音的深度学习方法总结

文章目录1 鲁棒性的损失函数2 鲁棒性的架构3 正则化4 调整损失函数5 样本选择6 元学习7 半监督学习深度学习模型往往需要大量的标记正确的数据，而现实世界的数据集中有8%~38.5%的数据是被污染的。现在的深度学习模型很容易对存在噪音的数据集过拟合，从而使得模型在测试集上的表现较差。现在比较流行的防止模型过拟合的方法：数据增强，权重衰减，dropout, batch normalization等方法并不能很好的解决这一问题。1 鲁棒性的损失函数这类方法通过改编损失函数，使得模型在噪音数据集上训
复制链接

扫一扫

专栏目录

miguemath CSDN认证博客专家 CSDN认证企业博客

码龄13年

39: 原创

5万+: 周排名

115万+: 总排名

27万+: 访问

: 等级

2340: 积分

171: 粉丝

309: 获赞

146: 评论

1204: 收藏

私信

关注

热门文章

分类专栏

自然语言处理 2篇
tensorflow 1篇
论文 11篇
机器学习 5篇
元学习 12篇
Pytorch 11篇
Java 1篇
算法与数据结构 1篇
英文学习 1篇
#Latex 1篇
Python 9篇
图形学 2篇
leetcode 1篇

最新评论

miniImageNet数据集介绍
愛與誠: 没有限制，但是发纯理论的论文，一般是做5 way或者20 way的实验
miniImageNet数据集介绍
加菲猫战神: 所以说小样本和少样本到底是不是一个东西，这一个类别有600个，算少样本，还是说小样本是尺寸小？
miniImageNet数据集介绍
superman_mxx: 请问下小样本分类输入的图像类别没有限制吧？还是说只能输入两类物体呢？我想通过其他数据集训练得到一个权重，然后进行我的数据集检测（我的种类是5类）
MAML复现全部细节和经验教训（Pytorch）
chenchen9422: 同学，你跑了MAML的代码了么，大概需要多久啊？
MAML模型无关的元学习代码完整复现（Pytorch版）
chenchen9422: 同学，你跑了么，我也想问问大概多久？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。