此为Transformer学习记录,分享本人所找到的较好的课程、博客等供记录交流。
原始transformer用于NLP领域:1.从全局角度概括Transformer_哔哩哔哩_bilibili
看完视频后看:Transformer学习笔记一:Positional Encoding(位置编码) - 知乎 (zhihu.com)
此博主和视频解析思路一致,分块讲解其中各部。
视觉transformer: VIT ViT论文逐段精读【论文精读】_哔哩哔哩_bilibili
已经对其有了较为很好的了解。
挑选最新或最关注领域的模型参考此篇综述:最新综述!一文详解视觉Transformer在CV中的现状、趋势和未来方向(分类/检测/分割/多传感器融合) - 知乎 (zhihu.com)
Swin Transformer :Swin Transformer论文精读【论文精读】_哔哩哔哩_bilibili
语义分割TRM :TransUNet segformer PVT