【论文笔记】《RecursiveMix: Mixed Learning with History》

想吃可爱多_

已于 2022-11-01 14:51:51 修改

阅读量229

点赞数 2

文章标签：论文阅读人工智能深度学习计算机视觉神经网络

于 2022-10-31 21:40:41 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_62581245/article/details/127622685

版权

目录

融合训练历史

概括

本文提出了一种可以更加充分利用训练集的训练方式，可直接应用到分类模型，也可推广到下游任务

在训练阶段，混合训练历史信息，迭代的把上一个iteration的batch缩小后粘贴在当前batch进行训练，当然也会相应的调整当前batch的标注文件（分类标注）和损失函数的构成

此法可以强化模型学习多尺度信息，通过对比学习使模型具有目标识别时空间不变性的优点

使模型增加很小的训练代价获得更好的鲁棒性

融合训练历史

上图三个图片对应了三个iteration，前一个iter的输入缩小后会粘贴在下一个iter的输入，然后递归的往后执行相同操作，所以第三个iter的输入会同时包含三张图片，当然之前的图片信息会越来越小。

公式(1)解释了这一操作，M是一张（0 - 1）mask，它和图片一样大。值是1的区域代表当前iter要被上一个iter的输入覆盖的区域，覆盖前会先把图片缩小成相应大小；1 - M是剩余区域。

由公式(2)粘贴的区域有多大由λ决定，λ 代表前一个iter图片缩小的比例，它更是代表了历史信息的占比程度

标注文件也要相应的调整，就像第二个式子那样，上一个标注乘以 λ 和当前标注乘以 λ-1 后相加，效果如下，第一个灰灰的柱子刚开始一定是1了，后来就这样迭代地加权相加

第3、4个式子就表明这是个迭代操作，上标 t 代表当前代，上标 h 代表上一代

构造损失

公式(3)描述了由输入得到多标签概率输出 p 的过程，F是特征提取网络，得到特征图，然后池化、全连接得到概率输出向量p。之后就可以和前面处理过的新标注求损失Loss-CE了。

公式(4)又提取了一种输出，把当前iter被历史覆盖的区域抠出来再过一遍模型得到局部视野的多标签概率输出 p_roi。作者把这个操作理解为了“mask-rcnn”的RoIAlign（把被粘贴覆盖的那块区域当作RPN输出的Anchor，不懂得朋友可以去查一下），其中最后的线性层和全局输出是不同的。

这个过程如上图，p_roi显然是要和上一个iter的输出求损失了，因为他们的从局部视野来看输入缩放后是相同的，不过因为网络参数不同还有整体的输入不同，输出当然是不同的了，不过我们希望他们在一定程度上是相似的。所以这部分的损失使用了KL-散度，它可以衡量两个分布之间的相似度，图中两者也确实从直观上很像是两个离散型随机变量分布律。他没有采用平时采用的交叉熵，因为求损失的双方不再是像概率输出和multi-hot编码那样。

最终的损失是两种损失的加权和，w是配重超参，λ也起到配重的作用。

想吃可爱多_

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
2
评论
【论文笔记】《RecursiveMix: Mixed Learning with History》

多尺度融合，multi-scale，历史信息融合，mix
复制链接

扫一扫

想吃可爱多_ CSDN认证博客专家 CSDN认证企业博客

码龄3年

7: 原创

131万+: 周排名

28万+: 总排名

1万+: 访问

: 等级

152: 积分

17: 粉丝

27: 获赞

20: 评论

79: 收藏

私信

关注

热门文章

最新评论

【论文笔记】Prompt-Guided Zero-Shot Anomaly Action Recognitionusing Pretrained Deep Skeleton Features
CSDN-Ada助手: 恭喜您写了第7篇博客！标题看起来非常专业，我对您在“Prompt-Guided Zero-Shot Anomaly Action Recognition using Pretrained Deep Skeleton Features”这个领域的研究充满敬意。您在论文笔记中的详细分析和总结非常有启发性，展示了您对该主题的深入理解。在下一步的创作中，我建议您可以考虑更多实验结果的讨论和展望。例如，可以对不同类型的动作异常进行更详细的分类和分析，以及与其他方法的比较和性能评估。这样可以进一步加深读者对您的研究的理解，并为未来的研究提供更多的启示。再次恭喜您的持续创作，期待在您的下一篇博客中继续学习到更多有价值的知识！
【cvpr2022-论文笔记】《Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation》
weixin_52906455: 讲的太好了，救我大命
【CVPR2023-论文笔记】《Bidirectional Copy-Paste for Semi-Supervised Medical Image Segmentation》
ztgzttt: 本科生，这个写的也太好了吧
【CVPR2023-论文笔记】《Bidirectional Copy-Paste for Semi-Supervised Medical Image Segmentation》
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【CVPR2023-论文笔记】《Bidirectional Copy-Paste for Semi-Supervised Medical Image Segmentation》
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。