transformer入坑指南

*免责声明:
1\此方法仅提供参考
2\搬了其他博主的操作方法,以贴上路径.
3*

场景一: Attention is all you need

场景二: VIT

场景三: Swin v1

场景四: Swin v2

场景五: SETR

场景六: TransUNet

场景七: SegFormer

场景八: PVT

场景九: Segmeter

场景一:Attention is all you need

论文地址

强推–》国外学者的解读

强推–》国内学者对国外学者解读的翻译

1.1 概述

强推先看–> 《场景三:seq2seq与attention机制》

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

1.2 transformer网络结构

细讲 | Attention Is All You Need

在这里插入图片描述

1.3 encoder

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.4 decoder

tarnsformer里面的decoder阶段的mask的作用与数学描述

在这里插入图片描述

1.5 输入端 (位置编码)

在这里插入图片描述

在这里插入图片描述

1.6 encoder与decoder的交互形式

在这里插入图片描述

在这里插入图片描述

场景二: VIT (Vision Transformer)

论文地址

Vision Transformer详解

ViT(Vision Transformer)解析

【机器学习】详解 Vision Transformer (ViT)

1.1 概述

MLP更多请看–> 《场景六:神经网络》
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.2 VIT网络结构

在这里插入图片描述

1.3 输入端编码处理

图片编码

在这里插入图片描述

用于分类的class编码

在这里插入图片描述
位置编码
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.4 encoder

强推–>transformer系列基础知识先导篇

【正则化】DropPath/drop_path用法

在这里插入图片描述

1.5 MLP Head

强推–>MLP更多知识可查看 《场景五1.4 与场景六》
在这里插入图片描述

1.6 ViT-B/16结构图

在这里插入图片描述

1.7 hybrid model (cnn与transformer结合的混合模型)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.8 参数调节

在这里插入图片描述

1.9 实验结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

场景三:swin v1

Swin Transformer 论文地址

github工程项目地址

参考一:Swin-Transformer网络结构详解

参考二:论文详解:Swin Transformer

参考三:详解Swin Transformer核心实现,经典模型也能快速调优

1.1 前言

在这里插入图片描述

1.2 网络结构

在这里插入图片描述
在这里插入图片描述

1.3 输入端编码处理

在这里插入图片描述

1.4 W-MSA ( Window Mutil-head Attention )

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

1.5 SW-MSA ( Shifted Window Mutil-head Attention)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.6 Patch Merging

在这里插入图片描述

1.7 相对位置偏置

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

1.8 模型结构图

在这里插入图片描述
在这里插入图片描述

1.9 性能

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

you did it
在这里插入图片描述

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值