干货!使用随机卷积改善视觉表征的鲁棒和泛化性能

本文介绍了如何通过随机卷积进行数据增强,以改善深度神经网络在计算机视觉任务中的鲁棒性和泛化性。研究发现,随机卷积能够保留图像形状并扭曲局部纹理,从而创建多样化的图像表示。这种方法在PACS和ImageNet-Sketch等泛化基准上表现出色,提高了模型的领域泛化能力,并且能为下游任务提供更稳健的预训练视觉表征。
摘要由CSDN通过智能技术生成

点击蓝字

20aa588187c9b65cd9d320f69054c3ae.png

关注我们

AI TIME欢迎每一位AI爱好者的加入!

虽然深度神经网络已经在各种计算机视觉任务中取得了成功,但其易受到纹理风格转变和小的扰动的影响,而人类对这些扰动是稳健的。在《Robust and Generalizable Visual Representation Learning via Random Convolutions》这篇论文中,作者使用随机卷积进行数据增强,极大的改善了神经网络的鲁棒性。随机卷积是近似地保留图像中的形状,并可能扭曲局部纹理。直观地说,随机卷积会创造出无限多的具有类似全局形状但随机局部纹理不同的新域。

因此,作者探索使用多尺度随机卷积的输出作为新的图像,或者将其与原始图像线性混合进行训练。当使用论文中提出的方法训练的网络应用于未见过的领域时,该方法一直在提高领域泛化基准的性能,并且可以扩展到ImageNet。特别是在泛化到PACS中的素描领域和ImageNet-Sketch这一具有挑战性的情况下,作者所提方法以很大的优势胜过了最先进的方法。更有趣的是,该方法可以通过提供一个更稳健的预训练的视觉表征使下游任务受益。

本期AI TIME PhD直播间,我们有幸邀请到了本文的作者徐震林博士为大家分享这项研究工作!

嘉宾介绍

00530460af48b0fed74ae99565561001.png

徐震林:

UNC Chapel Hill 计算机系博士生,研究兴趣为 data efficiency, robustness and generalization in visual representation learning。

个人主页:

https://wildphoton.github.io/

背      景</

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值