青出于蓝而胜于蓝，超越MixUp、CutMix的样本混合数据增广新算法FMix

我爱计算机视觉

于 2020-03-01 23:59:21 发布

阅读量1.3k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/moxibingdao/article/details/106667792

版权

点击我爱计算机视觉标星，更快获取CVML新技术

深度学习实践中，数据的增广有很多种方法，比如在计算机视觉任务中除了常规的对单样本进行缩放、颜色扰动、旋转、镜像等外，也可以通过对两个样本进行混合，生成新的虚拟样本训练集。这类方法被称为样本混合数据增广（Mixed Sample Data Augmentation，MSDA），比如MixUp。

MixUp 方法公式：

通过对两个样本标签和输入向量的加权，生成新的虚拟训练样本。

前天新出的论文Understanding and Enhancing Mixed Sample Data Augmentation，来自英国南安普顿大学的研究学者从信息论的角度试图理解这种方法的原理，并提出了新的数据增广方法FMix，在多个数据集上均表现SOTA。

FMix是在CutMix的启发下对方法的推广。

我们先看看看CutMix做了什么。

Mixup是在全图上进行加权，CutMix是在图像上取方块的位置再加权混合像素，CutMix取得了更好的效果。

作者们提出的FMix则是对图像按照高频和低频区域进行二值化区分区域，然后使用此Mask进行分像素的加权。

如下图：

论文的实验在图像分类（CIFAR-10、CIFAR-100、Fashion、ImageNet）、文本分类（Toxic）等任务中显示，FMix取得了一致的性能提升，是目前最先进的样本混合数据增广方法。

论文中还进行了理论分析，作者也已经将代码开源了，欢迎大家试用！

论文地址：

https://arxiv.xilesou.top/pdf/2002.12047.pdf

代码地址：

https://github.com/ecs-vlc/FMix

在我爱计算机视觉公众号后台回复“FMix”，即可收到论文下载地址。

加群交流

关注最新最前沿的图像标注与数据增广技术，欢迎加入交流群群，扫码添加CV君拉你入群，（如已为CV君其他账号好友，请直接私信）

（请务必注明:数据）：

喜欢在QQ交流的童鞋可以加52CV官方QQ群：805388940。

（不会时时在线，如果没能及时通过还请见谅）

长按关注我爱计算机视觉

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。