Transformer技术路线综述——Paddle

梁小憨憨

已于 2022-09-05 09:52:24 修改

阅读量778

点赞数 2

分类专栏：深度学习文章标签：人工智能

于 2021-05-31 09:19:39 首次发布

原文链接：https://aistudio.baidu.com/aistudio/education/group/info/21696

版权

深度学习专栏收录该内容

51 篇文章 24 订阅

订阅专栏

本篇为《深度学习》系列博客的第十三篇，该系列博客主要记录深度学习相关知识的学习过程和自己的理解，方便以后查阅。

本篇ppt来自于百度的《百度顶会论文复现营第2期》课程，如想了解详情，请移步上述课程链接。

在这里插入图片描述

传统注意力机制

在这里插入图片描述

Transformer注意力机制

在这里插入图片描述

Transformer在CV中的应用

在这里插入图片描述

Wu B , Xu C , Dai X , et al. Visual Transformers: Token-based Image Representation and Processing for Computer Vision[J]. 2020. https://arxiv.org/abs/2006.03677

Dosovitskiy, A. , et al. “An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale.” (2020). https://arxiv.org/abs/2010.11929

Han, K. , et al. “Transformer in Transformer.” (2021). http://arxiv.org/abs/2103.00112 在这里插入图片描述
Zheng, S. , et al. “Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers.” (2020). https://arxiv.org/abs/2012.15840

Carion, N. , et al. “End-to-End Object Detection with Transformers.” (2020). https://arxiv.org/abs/2005.12872

Zou, Cheng , et al. “End-to-End Human Object Interaction Detection with HOI Transformer.” (2021). https://arxiv.org/abs/2103.04503

Zhu, X. , et al. “Deformable DETR: Deformable Transformers for End-to-End Object Detection.” (2020). http://arxiv.org/abs/2010.04159v4
在这里插入图片描述
Chen, H. , et al. “Pre-Trained Image Processing Transformer.” (2020). https://arxiv.org/abs/2012.00364