transformer

最新推荐文章于 2024-05-24 19:22:36 发布

zxucver

最新推荐文章于 2024-05-24 19:22:36 发布

阅读量3.5k

点赞数 1

分类专栏： CV tasks # Popular Opts 文章标签： transformer 深度学习

本文链接：https://blog.csdn.net/chaipp0607/article/details/120520833

版权

CV tasks 同时被 2 个专栏收录

68 篇文章 23 订阅

订阅专栏

Popular Opts

15 篇文章 1 订阅

订阅专栏

简介

transformer最早于2017年google机器翻译团队提出，也就是著名的
《Attention Is All You Need》，transformer完全取代了以往的RNN和CNN结构，改为由transformer堆叠的方式构建模型。
transformer在NLP领域首先取得了非常惊人的效果，随后,ECCV2020，DETR：《End-to-End Object Detection with Transformers 》首次将transformer引入到了CV的目标检测任务重，随后VIT：《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》完全抛弃了CNN，改为完全由transformer实现基础的图像分类任务，之后transformer在CV领域的应用也变得一发不可收拾。

基本概念

Transformer

transformer是一种网络结构，是一种seq2seq的模型，最开始用于处理机器翻译任务，transformer由encoder和decoder组成，encoder或者decoder又是由多个encoder block和decoder block堆叠而成，encoder block和decoder block分别是用直连，Multi-Head Attention，BN，全连接等基础层通过不同的方式组合连接而成。
在这里插入图片描述

Multi-Head Attention

Multi-Head Attention 包含多个 Self-Attention 层，同一个输入分别传递到 n个不同的 Self-Attention 中，计算得到 n 个输出结果。得到n个输出矩阵之后，Multi-Head Attention 将它们拼接在一起 (Concat)，然后传入一个Linear层，得到 Multi-Head Attention 最终的输出。