论文阅读
文章平均质量分 58
一碗白开水一
这个作者很懒,什么都没留下…
展开
-
【tricks: rep-parameters】
组合:3x3卷积核+BN,组合2:1x1卷积核+BN,组合3:BN。这三种组合在推理计算上都可以等效转化成“3x3卷积核+偏置”的形式。我们都知道卷积也是一种线性运算如乘法一样,咱们把三组同规格的卷积核合并成一组卷积核的操作是很简单的。.........原创 2022-06-30 15:32:22 · 143 阅读 · 0 评论 -
【论文阅读】Swin Transformer V2: Scaling Up Capacity and Resolution
题目:Swin Transformer V2: Scaling Up Capacity and Resolutionmotivation:作者提出了将Swin Transformer缩放到30亿个参数的技术 ,并使其能够使用高达1536×1536分辨率的图像进行训练。作者要做大做强。method:首先,对大型视觉模型的实验揭示了训练中的不稳定性问题。作者发现,在大型模型中,各层之间的激活幅度差异显著增大。仔细观察结构可以发现,这是由直接添加回主分支的残差单元的输出引起的。结果是激活值逐层累积,原创 2022-03-08 15:06:28 · 4176 阅读 · 0 评论 -
【论文阅读】ATSS:Adaptive Training Sample Selection
题目:Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selectionmotivation:作者想找到anchor base 和anchor free 的区别,并设计一种anchor选取的方法。method :分析下RetinaNet和FCOS在算法上的差异,主要有以下3点:RetinaNet在特征图上每个点铺设多个anchor,而FCOS在特征图上每个点原创 2022-02-28 15:09:39 · 181 阅读 · 0 评论 -
【论文阅读】Generalized Focal Loss
Generalized Focal Loss原创 2022-02-24 11:38:05 · 307 阅读 · 0 评论 -
【论文阅读】DBNet:Real-time Scene Text Detection with Differentiable Binarization
题目:Real-time Scene Text Detection with Differentiable Binarizationmotivation:文字检测算法可以大致分为两类:基于回归的方法和基于分割的方法。基于分割的方法先通过网络输出图片的文本分割结果,使用预设的阈值将分割结果图转换为二值图。使用阈值来判定前景和背景的操作,这个操作是不可微的,所以无法使用网络将该部分流程放入到网络中训练,本文通过学习threshmap和使用可微的操作来将阈值转换放入到网络中训练。作者想让二值化更牛逼。met原创 2021-12-02 17:04:29 · 3113 阅读 · 0 评论 -
【论文阅读】YOLO-X:Exceeding YOLO Series in 2021
题目:YOLOX: Exceeding YOLO Series in 2021原创 2021-08-05 11:52:15 · 6617 阅读 · 0 评论 -
【论文阅读】DETR (ECCV2020)|End-to-End Object Detection with Transformers
题目:End-to-End Object Detection with Transformers作者:Facebook AI – Nicolas Carion , Francisco Massa , Gabriel Synnaeve, Nicolas Usunier,Alexander Kirillov, and Sergey Zagoruykomotivation:作者想直接预测无序集合method:亮点我觉得有2:1)采用了transformer的模型架构;2)采用匈牙利算法的无序预原创 2021-07-28 17:51:04 · 455 阅读 · 0 评论 -
[论文阅读]YOLOF:You Only Look One-level Feature
题目:作者:motivation:YOLOF虽然和YOLO没啥关系,针对FPN做的一个工作,理论创新性还是蛮大的methods:experiments:原创 2021-06-21 10:37:10 · 216 阅读 · 0 评论 -
[论文阅读]:PP-YOLO: An Effective and Efficient Implementation of Object Detector
题目:PP-YOLO: An Effective and Efficient Implementation of Object Detector作者:Xiang Long, Kaipeng Deng, Guanzhong Wang, Yang Zhang, Qingqing Dang,Yuan Gao, Hui Shen, Jianguo Ren, Shumin Han, Errui Ding, Shilei Wen(百度团队)motivation: 还是速度和效果不能兼得的问题,作者想兼得速度与效果原创 2021-04-13 17:39:35 · 501 阅读 · 0 评论 -
[论文解读]ICCV2019|Cascade RetinaNet: Maintaining Consistency for Single-Stage Object Detection
题目:Cascade RetinaNet:Maintaining Consistency for Single-Stage Object Detection作者:HongKai Zhang; Hong Chang;BingPeng Ma等Motivation:作者认为RetinaNet天真的直接将相同设置的多级串联在一起是没有多大收获,主要是类别的置信度和坐标之间的错误联系,以及不同Stag...原创 2019-10-09 10:36:24 · 853 阅读 · 0 评论 -
[论文解读]ICCV 2019|LRF:Learning Rich Features at High-Speed for Single-Shot Object Detection
题目:Learning Rich Features at High-Speed for Single-Shot Object Detection作者:Tiancai Wang, Rao Muhammad Anwer , Hisham Cholakkal , Fahad Shahbaz Khan Yanwei Pang , Ling Shao 2Motivation:作者认为从头开始训练太慢,但又怕失去精度,因此提出在backbone旁边加一个LSN网络,合并两者优点;并且觉得top-down的网络,原创 2020-11-25 17:58:29 · 239 阅读 · 0 评论 -
[论文阅读]ResNetXt|Aggregated Residual Transformations for Deep Neural Networks
题目: Aggregated Residual Transformations for Deep Neural Networks作者: Saining Xie; Ross Girshick ; Piotr Doll´ar;Zhuowen Tu; Kaiming He看到Kaiming He就不陌生了吧Motivation:作者还是为了找到一种更优的方法或者卷积方式来做目标分类。于是乎提出ResNetXt。Method:作者想出这样一种方法:a)b)只是concatenate的方法不一样,c原创 2020-08-12 17:05:22 · 965 阅读 · 0 评论 -
【论文阅读】DetectoRS|Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution
题目:DetectoRS:Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution作者:Siyuan Qiao Liang-Chieh Chen Alan YuilleMotivation:作者看到很多目标检测的网络都采用looking and thinking twice 的机制,然后作者也想来爽一把,于是乎牛逼的DetectoRS问世了。Methods:本文主要体现looking and原创 2020-08-12 13:34:14 · 606 阅读 · 0 评论 -
[论文阅读]Cascade RCNN|Cascade R-CNN: Delving into High Quality Object Detection
题目:Cascade R-CNN: Delving into High Quality Object Detection作者:Zhaowei Cai ; Nuno VasconcelosMotivation:作者认为在目标检测过程中,决定正负样本的IOU通常会产生检测噪声,随着IOU增加,效果却变差。作者认为是由于1)单纯提高了IoU阈值,满足这个阈值条件的proposals必然比之前少了,IOU增加,正样本数量少,容易导致过拟合,导致检测效果变差。2)在inference阶段,proposal与训练原创 2020-08-11 11:24:37 · 325 阅读 · 0 评论 -
[论文解读]CVPR 2020|EfficientDet: Scalable and Efficient Object Detection
论文题目:EfficientDet: Scalable and Efficient Object Detection论文作者:Mingxing Tan Ruoming Pang Quoc V. Le注:以下是个人解读,若有出入之处,还请指出。Motivation:作者认为检测效果好的网络,模型都比较大,而且速度大都比较慢。检测速度快的网络,大都检测效果差,因此,提出EfficientDet...原创 2019-12-13 17:55:49 · 1403 阅读 · 0 评论 -
[论文解读]CVPR2019|RePr: Improved Training of Convolutional Filters
题目:RePr: Improved Training of Convolutional Filters作者:Aaditya Prakash ; James Storer;Dinei Florencio, Cha ZhangMotivation:作者认为,所有训练好的网络都是可以在不明显降低效果的同时,对网络进行剪枝。这是因为网络的卷积核有一些不必要的重复。...原创 2019-07-02 10:43:11 · 470 阅读 · 0 评论 -
[论文解读]CVPR2019|Adaptive NMS:Refining Pedestrian Detection in a Crowd
题目:Adaptive NMS:Refining Pedestrian Detection in a Crowd作者:Songtao Liu、Di Huang 、Yunhong WangMotivation:作者认为Soft NMS 与Greedy NMS 一样,只能在一定程度上解决目标不被NMS筛掉;如果降低阈值则会导致准确率下降。因此提出Adaptive NMS。Related wor...原创 2019-07-01 15:03:27 · 1888 阅读 · 0 评论 -
[论文解读]EECV 2018|RFB Net:Receptive Field Block Net for Accurate and Fast Object Detection
题目:Receptive Field Block Net for Accurate and FastObject Detection作者:Songtao Liu, Di Huang, Yunhong WangMotivation:作者认为目前表现好的目标检测主要基于较深的网络(例如Resnet,Inception),其缺点就是大量的计算成本,速度慢。而一些轻量级的网络速度较快,但检测的精度...原创 2019-06-25 11:08:54 · 602 阅读 · 0 评论 -
[论文解读]CVPR2019 | FSAF:Feature Selective Anchor-Free Module for Single-Shot Object Detection 自动选择特征层
本文解读了《Feature Selective Anchor-Free Module for Single-Shot Object Detection》,并作大概纪要。原创 2019-06-05 13:35:15 · 1675 阅读 · 0 评论 -
[论文解读]|PAN:Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network
题目:Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network作者:Wenhai Wang, Enze Xie,Xiaoge Song, Yuhang Zang, Wenjia Wang, Tong Luy, Gang Yu, and Chunhua ShenMotivation:...原创 2020-04-21 14:02:40 · 1264 阅读 · 5 评论 -
[论文解读]AAAI 2019|M2Det:A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network
论文题目:A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network论文作者:Qijie Zhao , Tao Sheng ,Yongtao Wang , Zhi Tang , Ying Chen , Ling Cai and Haibin Ling原创 2019-06-11 13:46:28 · 893 阅读 · 0 评论 -
[论文解读]ICCV2019|Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty
题目:Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty作者:Jiwoong Choi , Dayoung Chun, Hyun Kim , Hyuk-Jae LeeMotivation:作者认为在常规的single stage目标检测网络中,分数和边框都是单独回归的,而回...原创 2019-09-04 16:23:05 · 4784 阅读 · 1 评论 -
[论文解读]Consistent Optimization for Single-Shot Object Detection将置信度与边框联系起来
论文题目:Consistent Optimization for Single-Shot Object Detection作者:Tao Kong 1 Fuchun Sun 1 Huaping Liu 1 Yuning Jiang 2 Jianbo Shi 3目前,大多数的Detector模型改进方法都集中在了two-stage阵营中,比如Cascade R-CNN、IoU-Net,One-S...原创 2019-06-06 16:21:38 · 941 阅读 · 0 评论 -
[论文解读]arXiv 219|MobileNetV3: Searching for MobileNetV3
题目:Searching for MobileNetV3作者:Andrew Howard 、 Mark Sandler 、 Grace Chu 、 Liang-Chieh Chen 、 Bo Chen 、Mingxing Tan…Motivation:作者还是想在移动端使网络的性能发挥到极致,从而提出了MobileNetV3-Large 、MobileNetV3-Small。Related...原创 2019-12-17 11:58:15 · 480 阅读 · 0 评论 -
[论文解读]ICML 2019|EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
题目:EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks作者:GOOGLE Mingxing Tan Quoc V. LeMotivation:作者认为网络的扩展是对效果有很大帮助的,但是人们一直没有找到一个有效的扩展方法,作者发现在网络扩展时,通过平衡网络的深度、宽度、像素大小之间的关系来建模,...原创 2019-12-25 14:13:00 · 813 阅读 · 0 评论 -
[论文阅读]Object Detection With Deep Learning: A Review
题目:Object Detection With Deep Learning: A Review作者:Zhong-Qiu Zhao、 Peng Zheng、Shou-Tao Xu, and Xindong WuMotivation:作者想写一篇综述Methods:作者介绍了传统目标检测的三步:感兴趣区域提取、特征提取、分类作者又说了目标检测的领域划分,然后分别作详细介绍。然后作者分...原创 2020-04-22 10:51:28 · 1923 阅读 · 2 评论 -
[论文阅读]YOLOv4| YOLOv4:Optimal Speed and Accuracy of Object Detection
题目:YOLOv4: Optimal Speed and Accuracy of Object Detection作者:Alexey Bochkovskiy, Chien-Yao Wang,Hong-Yuan Mark Lia【Joseph 因为他的作品被用到了军事等领域,今年2月宣布退出CV, 向yolo创始人Joseph Redmon致敬!】Motivation:作者认为常规的网络在一...原创 2020-04-27 16:26:15 · 565 阅读 · 0 评论 -
[论文阅读] CVPR2017|DFF:Deep Feature Flow for Video Recognition
题目:Deep Feature Flow for Video Recognition作者:Xizhou Zhu Yuwen Xiong Jifeng Dai Lu Yuan Yichen WeiMotivation:作者认为视频目标检测每一帧上用CNN计算特征太慢了,两个相邻帧有相似的feature map,就想用光流算法来做中间的帧。于是DFF就出来了。Methods:这里作者通过可视化resnet101最后一个卷积层里面的两个卷积核输出的特征来进行了验证。可以看到中间的特征图上激活的原创 2020-05-21 15:54:44 · 762 阅读 · 0 评论 -
[论文阅读]DeepOtsu:Document Enhancement and Binarization using Iterative Deep Learning
题目:DeepOtsu:Document Enhancement and Binarization using Iterative Deep Learning作者:Sheng He , Lambert Schomaker**Motivation:**作者想用一种新颖的方式来替代传统的Otsu, 于是加入深度学习的方式构建DeepOtsu.methods:作者试图找到背景噪声e,因此设计网络:一次不够,就多次减去噪声:Experments:我觉得文章在领域内应用比较有新意,其他就不多原创 2020-06-16 13:44:51 · 382 阅读 · 0 评论 -
[论文阅读]CCPD|Towards End-to-End License Plate Detection and Recognition: A Large Dataset and Baseline
题目:Towards End-to-End License Plate Detectionand Recognition: A Large Dataset and Baseline作者:Zhenbo Xu ;Wei Yang;etc…Motivation:作者认为目前现有的数据集都比较小,于是作者整个大的CCPD,然后基于这个数据集又设计了一个检测模型。Methods:作者通过各种办法做了这个数据集,很丰富,很感人。然后主要看作者设计的检测模型:The Roadside Parking Net原创 2020-07-23 14:03:47 · 1134 阅读 · 0 评论 -
[论文解读]ECCV2018|PFP-Net:Parallel Feature Pyramid Network for Object Detection
题目:Parallel Feature Pyramid Network for Object Detection作者:Seung-Wook Kim, Hyong-Keun Kook, Jee-Young Sun,Mun-Cheon Kang, and Sung-Jea KoMotivation:作者认为像金字塔形式的Feature map的网络,限制了网络的表现,尤其对于小目标的检测。对此,...原创 2019-07-04 13:56:23 · 554 阅读 · 0 评论 -
[论文阅读]CBNet|A Novel Composite Backbone Network Architecture for Object Detection
题目: A Novel Composite Backbone Network Architecture for Object Detection作者: Yudong Liu,1 Yongtao Wang,1 Siwei Wang,1 TingTing Liang,1Qijie Zhao,1 Zhi Tang,1 Haibin Ling 2Motivation:作者觉得目标检测网络的backbone非常重要,于是要优化一个牛逼的backbone出来,于是乎CBNet问世。Method:就是把多个ba原创 2020-08-13 10:06:45 · 404 阅读 · 0 评论