《MobileViT:轻巧、通用、便于移动的视觉转换器》
论文地址:https://arxiv.org/abs/2110.02178
代码地址:https://github.com/chinhsuanwu/mobilevit-pytorch/blob/master
轻量级卷积神经网络(CNN)实际上是用于移动视觉任务的。他们的空间归纳偏差使他们能够在不同的视觉任务中以较少的参数学习表示。然而,这些网络在空间上是局部的。为了学习全局表示,已经采用了基于自我注意力的视觉变换器(ViT)。与CNN不同,ViT是重量级的。在本文中