swin transformer 模块理解
前言【个人学习笔记记录,如有错误,请指正】配置文件使用 swin_small_patch4_windows7_224.yaml 文件,batch_size = 4# 一、Patch Embedding【Patch embedding】其实就是将输入的 224 * 224 大小的图像,经过【卷积】和【LayerNorm】操作,将图像缩放为 56 *56 大小的特征图。然后将特征图reshape 为 (4, 3136, 96)形状,这里的 4 为【batch_size】,3136 = 56*56,.
原创
2022-01-12 15:17:30 ·
3666 阅读 ·
0 评论