文章目录 摘要 1、简介 2、相关工作 3、方法 3.1、稀疏视觉图注意力 3.2、SVGA块 3.3、MobileViG架构 4、实验结果 4.1、图像分类 4.2、目标检测和实例分割 5、结论 摘要 论文链接:https://arxiv.org/pdf/2307.00395.pdf 传统上,卷积神经网络(CNN)和视觉Transformer(ViT)在计算机视觉领域占据主导地位。然而,最近提出的视觉图神经网络(ViG)提供了一个新的探索途径。不幸的是,对于移动应用程序,由于将图像表示为图形结构的开销,ViG在计算上是昂贵的。在这项工作中,我们提出了一种新的基于图的稀疏注意机制,稀疏视觉图注意(SVGA)