Transformer
文章平均质量分 72
零尾
为了艾泽拉斯
展开
-
论文笔记33 -- (CV)【ICCV2021】Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
CV + Transformer论文:点这里官方代码:点这里第三方代码:点这里Ze Liu,Yutong Lin,Yue Cao,Han Hu,Yixuan Wei,Zheng Zhang,Stephen Lin,Baining GuoMicrosoft Research AsiaAbstract本文介绍了一种称为 Swin Transformer 的新的视觉 Transformer,它可以作为计算机视觉的通用 backbone。从语言到视觉的转换面临的挑战来自于两个领域之间的差异,例如视原创 2021-10-15 14:33:56 · 913 阅读 · 0 评论 -
论文笔记33 -- (细粒度识别)【CVPR2021】TransFG: A Transformer Architecture for Fine-grained Recognition
Transformer在细粒度领域的应用论文:点这里代码:点这里Ju He,Jie-Neng Chen,Shuai Liu,Adam Kortylewski,Cheng Yang,Yutong Bai,Changhu Wang,Alan YuilleJohns Hopkins University,ByteDance Inc.Abstract细粒度视觉分类(FGVC)的目的是从子类别中识别目标,因为类间存在着固有的细微差异,因此是一项非常具有挑战性的任务。最近的工作主要是通过定位最具辨别力的原创 2021-09-07 10:46:44 · 2004 阅读 · 0 评论 -
论文笔记32 -- Conformer: Local Features Coupling Global Representations for Visual Recognition
CNN + Transformer论文:点这里代码:点这里Zhiliang Peng,Wei Huang,Shanzhi Gu,Lingxi Xie,Yaowei Wang,Jianbin Jiao,Qixiang Ye国科大,华为,鹏城实验室Abstract在卷积神经网络 (CNN) 中,卷积操作擅长提取局部特征,但难以捕获全局表示。在Visual Transformer中,级联自注意力模块可以捕获长距离特征依赖关系,但不幸的是会破坏局部特征细节。在本文中,我们提出了一种称为 Confor原创 2021-09-02 14:56:05 · 5145 阅读 · 1 评论