![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
读论文
文章平均质量分 83
liiiiiiiiiiiiike
这个作者很懒,什么都没留下…
展开
-
End-to-End Object Detection with Transformers(DETR)论文阅读与理解
DETR原创 2022-06-30 17:40:11 · 851 阅读 · 0 评论 -
Swin Transformer网络架构、相应改进模块的理解
swin-TransformerTransformer越来越火,个人感觉基于Transformer来做视觉真是把矩阵用得出神入化!!Swin-Transformer相较于VIT改进的方法:SwinT使用类似CNN中层次化构建方法,这样的backbone有助于在此基础上构建检测和分割任务,而VIT中是直接一次性下采样16倍,后面的特征图都是维持这个下采样率不变。在SwinT中使用Windows Multi-head Self-Attention(WMSA)的概念,在上图中4倍下采样和8倍下采样中,原创 2022-01-06 14:32:20 · 9000 阅读 · 2 评论 -
YOLSO: You Only Look Small Object
按照李沐老师阅读论文的方法!!!(1)读abstract和introduction(2)读conclusion(3)看论文中model架构和实验结果图(4)再读剩下的重点: 一般读1,2,3如果你发现论文差不多看懂了,可以不用读下去了,但是如果你很感兴趣的话,可以再去读(4)这个部分,这里面有每个结构的详细介绍作者是基于yolov3 为baseline的改进的点:backbone中加入了HSSC moduleFPN中在每层特征图融合的地方加入额外的操作,作者起名为FPE,也就是Fe原创 2021-12-30 17:34:19 · 1615 阅读 · 0 评论