论文
文章平均质量分 84
donkey_1993
这个作者很懒,什么都没留下…
展开
-
CFNet: Cascade Fusion Network for Dense Prediction
在密集预测任务中多尺度的特征融合至关重要,当前的主流的密集预测的范式是先通过BackBone提取通用特征,然后通过特征融合模块来融合BackBone中的多尺度特征,最后使用head来输出密集预测结果(检测,分割等)。作者发现BackBone的网络参数量远远大于特征融合模块,基于此发现作者提出了级联融合网络结构(CFNet)来平衡BackBone和融合模块网络的参数占比。最终提出的网络结构在Imagenet,COCO,ADE20K等数据集上取得了领先的结果。原创 2023-03-06 11:35:52 · 3997 阅读 · 14 评论 -
SegNeXt: Rethinking Convolutional Attention Designfor Semantic Segmentation重新思考卷积注意力设计
在当前深度学习语义分割中Transformer占据了主流的方向。作者发现卷积神经网络的注意力机制比Transformer更加高效,更加高效地编码上下文信息。通过对比之前提出的优秀的语义分割模型,作者发现了提升模型分割精度的几个关键因素(如下表所示)。通过以上的发现,作者提出的注意力卷积神经网络SegNext,在VOC数据集上mIOU可以达到0.906地精度,在COCO,ADE20K等数据集上都能够达到先进的分割水平。原创 2022-09-27 10:10:06 · 1558 阅读 · 0 评论 -
Pyramid Grafting Network for One-Stage High ResolutionSaliency Detection高分辨率显著图检测算法
论文核心:论文提出了一个单阶段的高分辨率显著图检测算法。该网络结构编码层采用Transformer和cnn融合特征得到全局和局部特征信息,最后通过三段的解码层输出预测结果。论文提出了CMGM的网络结构块和AGL损失函数来融合矫正CNN和Transformer特征信息。同时提出了一个UHRSD的高分辨率数据集。论文整体网络结构:通过上图可以看出,该网络结构本质上是一个编码-解码的网络结构,只是在编码层使用了CNN和Transformer作为并行的编...原创 2022-04-27 11:35:10 · 694 阅读 · 0 评论 -
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks论文下载地址:https://arxiv.org/abs/1905.11946代码下载地址:https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet论文创新:在有限的资源下平衡网络深度,宽度和分辨率得到一个效果最好的网络结构。上图网络结构分别是(a).原创 2021-02-06 09:33:43 · 287 阅读 · 0 评论 -
POLY-YOLO: HIGHER SPEED, MORE PRECISE DETECTION AND INSTANCE SEGMENTATION FOR YOLOV3论文阅读
论文下载地址:https://arxiv.org/pdf/2005.13243.pdf代码下载地址:https://gitlab.com/irafm-ai/poly-yolo论文创新:在YOLOv3的基础上进行了改进,解决了YOLO-v3存在标签重写和anchor分布不均衡问题。同时还增加了基于多边形预测的实例分割算法。改进之后的算法参数量只需要YOLO-v3的60%,速度快了2倍,精度提升了40%,可以进行实时实例分割。YOLO-v3存在的问题:1. 标签重写问题:从下图可以看出YOL原创 2020-08-05 12:16:29 · 686 阅读 · 0 评论 -
Training-Time-Friendly Network for Real-Time Object Detection论文阅读
论文:Training-Time-Friendly Network for Real-Time Object Detection下载地址:https://arxiv.org/pdf/1909.00700v2.pdf代码地址:https://github.com/ZJULearning/ttfnet摘要:在当前目标检测算法中,很难有算法可以将训练时间,检测速度和检测精度三者协调起来。为了能够在这三种情况下找到一个有效的平衡,作者提出了TTFNet这个网络结构。在CenterNet的基础上在不减低精原创 2020-07-13 18:54:23 · 602 阅读 · 0 评论 -
End-to-End Object Detection with Transformers论文阅读笔记
论文下载地址: https://arxiv.org/abs/2005.12872代码下载地址: https://github.com/facebookresearch/detr摘要:该算法简化了目标检测算法的流程,同时将那些需要手动设计的技巧nms(极大值抑制)和anchor成功的删除掉,实现端到端自动训练和学习。DETR算法使基于集合的全局损失函数,通过二部图匹配和编码解码网络结构来强制进行唯一的预测。 给定一小组固定的经过学习的object queries(后面会讲到什么是object que.原创 2020-06-24 11:11:03 · 6447 阅读 · 0 评论 -
SOLO:Segmenting Objects by Locations阅读笔记
论文下载地址: https://arxiv.org/abs/1912.04488论文摘要: 当前实例分割算法大部分是先检测后分割的框架,例如Mask-RCNN算法。或者先进行语义分割,然后再通过聚类算法来进行分类。论文提出了一种实例类别概念,实例类别根据实例的位置和大小为实例中的每个像素分配类别,从而很好地将实例分割转换为可分类解决的问题。论文提出的犯法可以达到和Mask-R...原创 2020-04-08 15:28:13 · 2265 阅读 · 0 评论 -
ECCV2018 Deep Regression Tracking with Shrinkage Loss 目标跟踪收缩损失
Deep Regression Tracking with Shrinkage Loss论文下载地址:http://suo.im/4ThBkK论文代码:https://github.com/chaoma99/DSLT本论文是2018 ECCV。 提出问题:深度回归的跟踪算法现在得到了长足的发展,但是这些算法的准确率和鲁棒性比判别式相关滤波算法要差一些。解决问题:作者发现主要...原创 2018-10-18 22:11:06 · 3475 阅读 · 0 评论 -
多目标跟踪综述2
多目标跟踪:(Multiple Object Tracking or Multiple Target Tracking, MOT or MTT)主要任务是在给定视频中同时对多个感兴趣的目标进行定位,并且维持他们的ID、记录他们的轨迹。多目标跟踪主要存在的问题:1. 确定跟踪目标的数量2.维持各自的ID3.频繁的遮挡4.轨道初始化和终止5.相似的外观6.多目标之间的影...原创 2018-10-11 19:48:39 · 4677 阅读 · 1 评论 -
经典网络结构梳理:YOLO目标检测算法。
论文下载地址:https://pjreddie.com/media/files/papers/yolo.pdfcaffe代码下载地址:https://github.com/yeahkun/caffe-yoloYOLO:You Only Look Once: Unified, Real-Time Object Detection 是发表在2016年的CVPR。YOLO基础版可以达到45帧/s...原创 2018-08-07 19:11:13 · 6660 阅读 · 0 评论 -
为什么SSD目标检测算法对小目标检测的效果不好
在SSD算法中,每个feature map的像素点都会生成prior box,SSD通过prior box进而对feature map进行训练。文章中提到,SSD在训练过程中,prior box与GroundTruth的之间ROI 达到0.5才会放到网络里面进行训练。大的目标有可能ROI的值会大很多,因此包含的prior box就多,就可以得到充分的训练。相反小目标用于训练的的prior bo...原创 2018-08-06 21:43:31 · 10917 阅读 · 2 评论 -
经典网络结构梳理:SSD目标检测算法。
论文下载地址:https://arxiv.org/abs/1512.02325论文代码:https://github.com/weiliu89/caffe/tree/ssdSSD全称:Single Shot MultiBox Detector 是2016年ICCV的一篇论文。是目前为止主要的目标检测算法。算法的主要优点:1. 速度比Faster-Rcnn快,精度比YOLO高。(在...原创 2018-08-06 21:20:57 · 29538 阅读 · 3 评论 -
Learning Attentions: Residual Attentional Siamese Network for High Performance 论文读后感
Learning Attentions: Residual Attentional Siamese Networkfor High Performance Online Visual Tracking 2018年CVPR 王强大神的论文。王强大神维护的benchamark-results跟踪结果:https://git...原创 2018-05-23 20:55:18 · 8731 阅读 · 5 评论