- 博客(3)
- 收藏
- 关注
原创 论文阅读《Localizing Objects with Self-Supervised Transformers and no Labels》
本文链接2021-BMVC:https://arxiv.org/abs/2109.14279创新点:在论文DINO [1]中展示了通过自监督的方法可以学习到类似于语义分割标签的特征图,就是在特征图中,前景目标的区域被激活。受DINO的启发,本文提出了一种在特征图上定位前景目标的算法(LOST),并基于此算法自动生成图像的目标检测伪标签,训练目标检测模型。在特征图上定位前景目标的算法步骤:(0)算法假设:首先作者假设目标图像块之间的相关性大于和背景图像块的相关性;前景目标在图像中比较小,...
2022-03-11 21:49:54
4432
原创 VIT中提取图像分类特征的详细步骤
图1. VIT结构图VIT是第一篇纯视觉transformer,被当成了许多网络的backbone。现在自己梳理一下VIT怎么从一张图像中提取特征,最后用于分类的过程。(自己的理解,如有不对,欢迎指正)处理流程:第一步:输入一张尺寸为h*w*c的图像;第二步:将图像分成p*p*c的小块,那么一共可以获得n个图像块【n=(h*w)/(p*p)】,同时添加一个可学习的类别块,则总共有(n+1)个块待处理,这个类别块将用于与所有的图像小块进行交互,最终从类别块中学习到用于分类的特征;第三步..
2022-03-04 18:22:22
11149
3
原创 论文阅读《DETReg: Unsupervised Pre-training with Region Priors for Object Detection》
本文链接:https://arxiv.org/pdf/2106.04550.pdf问题及创新点:1.利用传统算法,选择一些可能存在物体目标的区域送入网络进行处理,作为伪标签(fbox);2.除了图像块伪标签,本文还采用其他预训练方法得到的基干网络来产生高维特征(femb)和块分类(fcat,是否是proposal块)作为伪标签上图中的Detector采用DETR或Deformable DETR,这部分即本文需要重新预训练的部分,后续用于下游任务中,Encoder采用别人已经训..
2022-02-28 20:57:24
612
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人