目标检测
文章平均质量分 92
M1kk0
这个作者很懒,什么都没留下…
展开
-
[GFL]Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Dete
Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Detection会议:CVPR 2021论文:https://arxiv.org/pdf/2006.04388.pdf代码:https://github.com/implus/GFocalAbstract目前的模型大多存在两个问题:问题一:在训练和推理的过程中,质量评估和分类的方法不一致:他们往往被独立训练原创 2021-07-14 17:12:50 · 853 阅读 · 0 评论 -
李宏毅老师Transformer课程笔记 [Attention is all your need]
Transformer会议:NIPS 2017论文:https://arxiv.org/pdf/1706.03762.pdfinput是x1~x4x_1~x_4x1~x4,经过embending之后得到a1~a4a_1~a_4a1~a4,输入到self-attention中。对于每一个input,都乘上三个不同的权值矩阵,得到三个不同的向量q,k,vq,k,vq,k,v。qqq:query (to match others) qi=Wqaiq^i=W^qa^iqi=Wqaikkk:k原创 2021-04-08 15:12:46 · 327 阅读 · 0 评论 -
End-to-End Object Detection with Transformers
End-to-End Object Detection with Transformers会议:2020 ECCV论文:https://arxiv.org/abs/2005.12872代码:https://github.com/facebookresearch/detr创新点:\作者摒弃了基于anchor、NMS等这种需要手工设计的模块,和R-CNN系列、YOLO系列,以及其他anchor-free的方法都不同,减少检测器对先验性息和后处理的依赖,做到了真正的end2end。使用类似机器翻译原创 2021-03-30 10:56:07 · 445 阅读 · 0 评论 -
Squeeze-and-Excitation Networks(SENet) 学习笔记
1. 简介作者提出了一个SE块的概念,它是根据channel之间的相关性来进行显式建模,从而实现自适应地channel-wise上的特征响应,把重要的特征进行强化、不重要的特征进行抑制来提升准确率。2. 网络结构FtrF_trFtr是传统的卷积结构,输入为H′×W′×C′H'\times W'\times C'H′×W′×C′的XXX,和H×W×CH\times W\times CH×W×C的UUU。SENet增加的是UUU后面的部分:首先对UUU进行一个Global Average Pooli原创 2020-08-13 18:53:26 · 299 阅读 · 0 评论 -
End-to-End Object Detection with Fully Convolutional Network
会议:CVPR 2021论文:https://arxiv.org/pdf/2012.03544.pdf代码:https://github.com/Megvii-BaseDetection/DeFCN创新点:基于FCOS,首次在dense prediction上利用全卷积结构做到E2E,即无NMS后处理。提出了POTO,实现了one-to-one的label assignment。提出了3D Max Filtering以增强feature在local区域的表征能力,并提出用one-to-man.原创 2021-04-08 15:07:27 · 487 阅读 · 0 评论 -
FCOS: Fully Convolutional One-Stage Object Detection
FCOS: Fully Convolutional One-Stage Object Detection会议:ICCV 2019论文:https://arxiv.org/abs/1904.01355代码:https://tinyurl.com/FCOSv1创新点:anchor-free、proposal-free,提出了中心度center-ness的思想。Abstract作者提出了一个基于FCN的one-stage检测器FCOS,与主流的方法如R-CNN系列不同,FCOS is anc原创 2021-03-30 10:47:32 · 354 阅读 · 0 评论 -
EfficientDet
EfficientDetCVPR 2020作者:谷歌大脑论文:https://arxiv.org/pdf/1911.09070.pdf代码(官方tensorflow):https://github.com/google/automl/tree/master/efficientdet代码(最强pytorch复现):https://github.com/zylo117/Yet-Another-EfficientDet-Pytorch创新点:提出了BiFPN,可更好地融合各个尺度的特征和Eff原创 2020-12-17 11:01:05 · 171 阅读 · 0 评论 -
EfficientNet
EfficientNetICML 2019作者:谷歌大脑论文:https://arxiv.org/pdf/1905.11946.pdf代码:https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet创新点:提出一个新的网络尺寸缩放的方法使用NAS搜索最优的网络结构Compound Scaling那么如何衡量网络尺寸呢,最直观的当然是网络中的参数量,如下图所示,横轴为网络中参数量,纵轴为网络的精度原创 2020-12-17 10:57:46 · 783 阅读 · 0 评论 -
YOLO v1学习笔记
YOLO v1论文:https://arxiv.org/abs/160.400640代码:https://github.com/pjreddie/darknet创新点:将整张图片作为网络的输入,直接在输出层对BBox的位置和类别进行回归。简介YOLO意思是You Only Look Once,创造性的将候选区和对象识别这两个阶段合二为一,属于one-stage的检测模型。整体上来说,首先将图片resize到448×448,送入到CNN网络之后,经过进一步预测得到检测的结果。YOLO是用原创 2020-11-16 15:07:43 · 250 阅读 · 0 评论 -
R-CNN + Fast R-CNN + SPP Net + Faster R-CNN详解
R-CNN全家桶R-CNN是将CNN方法引入目标检测领域, 大大提高了目标检测效果,可以说改变了目标检测领域的主要研究思路, 紧随其后的系列文章:R-CNN, Fast R-CNN, Faster R-CNN 。R-CNNRich feature hierarchies for accurate object detection and semantic segmentationCVPR2014作者:Ross Girshick论文:https://openaccess.thecvf.com/co原创 2020-09-25 09:28:02 · 639 阅读 · 0 评论 -
小目标检测模型总结+SNIP+SNIPER
小目标检测在MS COCO数据集中,对于面积小于32*32的物体,MS COCO就认为它是小物体,在评测时,会对这个范围内的物体计算APsmall。在行人库CityPerson中,原图大小为1024*2048,小目标定义为高度小于75的目标。目前小目标检测的方法大致有一下4类(不过这是2018年的回答了):Scale最简单粗暴的方法就是放大图片。这就是在尺度上做文章,如FPN(Feature Pyramid Network),SNIP(An Analysis of Scale Invarian原创 2020-10-11 16:45:20 · 5290 阅读 · 1 评论