论文阅读 Decoupling “when to update” from “how to update”

最新推荐文章于 2023-02-19 20:43:30 发布

Zealoe

最新推荐文章于 2023-02-19 20:43:30 发布

阅读量1.6k

点赞数

分类专栏： NIPS，论文笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Zealoe/article/details/78894490

版权

NIPS，论文笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

NIPS2017的文章。

之前我们设计supervised的NN都是采用从data中取出一些batch，然后用这些data来通过loss 来update 网络中的参数，但是有一个很明显的问题是，为了training，我们需要的data会很多，但是这些data会有noise，因为标注并不是所有的都那么准确。所以如果我们用错误的data label来update我们的network，很有可能我们的network此时预测正确了，但是label告诉network，它错了，这样update以后，performance会降低。这篇文章提出了我们要设计两个predictor，当两个predictor预测没有分歧的时候，网络不更新，有disagreement的时候网络才进行更新；也就是决定了when to update。

其实也就是maintain了两个网络，这两个网络的不同只是在于random initialization而已，然后只在这两个网络有分歧的时候才进行bp的更新。

为了证明这个方法的鲁棒性，作者在通过给定的face来预测gender的任务上进行实验，用的是Labled Faces in the Wild 数据集，原来数据集其中并没有gender label，只有每个人脸的name的label。gender label是作者在网上找了个根据name 预测gender的service来标的，所以噪声很大。作者在这个任务上表现很好，并且在clear的数据集上，作者的方法也表现的很好。

作者做了收敛性证明，这里就不展开了。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
论文阅读 Decoupling “when to update” from “how to update”

NIPS2017的文章。之前我们设计supervised的NN都是采用从data中取出一些batch，然后用这些data来通过loss 来update 网络中的参数，但是有一个很明显的问题是，为了training，我们需要的data会很多，但是这些data会有noise，因为标注并不是所有的都那么准确。所以如果我们用错误的data label来update我们的network，很有可能
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。