本文提出MLP 视觉新方法,构建了一个超级简单的残差架构,其残差块由一个隐藏层的前馈网络和一个线性patch交互层组成!当采用现代的训练方法,则可以在ImageNet上实现意想不到的高性能!代码即将开源!
这一周MLP真热闹啊,看看近期的新工作:
注1:文末附【视觉Transformer】交流群
注2:整理不易,欢迎点赞,支持分享!
想看更多CVPR 2021论文和开源项目可以点击:
CVPR2021-Papers-with-Code
ResMLP: Feedforward networks for image classification with data-efficient training
- 作者单位:Facebook AI(有DETR作者之一), 索邦大学, Inria
- 论文:https://arxiv.org/abs/2105.03404
我们提出了ResMLP,一种完全基于多层感知机(MLP)进行图像分类的体系结构。 它是一个简单的残差网络,它交替(i)线性层,其中图像 patches在通道之间独立且相同地交互;以及(ii)两层前馈网络,其中通道中的每个 patch独立地相互作用。