论文阅读
文章平均质量分 61
读论文,每天一篇
渐消散
这个作者很懒,什么都没留下…
展开
-
lisa traffic sign 数据集训练
1:lisa下载地址:http://cvrr.ucsd.edu/LISA/datasets.html2:解压缩后,使用python tools/splitAnnotationFiles.py将数据集划分成训练集和测试集的csv描述文件。3:转化csv为json格式。import mmcvimport osimport sysimport jsonimport cv2import numpy as np class_names = ['stop', 'speedLimitUrdbl', '原创 2020-07-22 23:59:49 · 3809 阅读 · 5 评论 -
医学小目标检测:Retina U-Net
论文:Retina U-Net: Embarrassingly Simple Exploitation of Segmentation Supervision for Medical Object Detection代码:https://github.com/MIC-DKFZ/medicaldetectiontoolkit这是一篇应用型论文,只是将U-Net和Retina 结合了一下,用于医学图像检测。比较的模型也很少:只是简单的用了Unet,比较老了注:Paul F. Jaeger, Sim原创 2020-07-17 23:05:38 · 2481 阅读 · 0 评论 -
基于SSD的小目标检测:Small Object Detection Algorithm Based on Feature Pyramid-Enhanced Fusion SSD
目前没有公开代码。开头前两节,现状和别人的工作。核心就在于在SSD的基础上进行了特征融合,其他方面没有改进。论文里把SSD结构画了一下,助于理解:文中选择了几个特征融合,网络模型如下,图画的难看懂,原图:可以看出是抽取了几个层,然后进行融合,重画图:右边是融合后新生成的特征,与原来的结合,再进行检测回归预测。再谷歌学术上搜索到的,几乎都是特征融合的方式。只不过选择的层不一样,融合的方式不一样,选择的基础网络不一样。...原创 2020-07-17 22:45:38 · 489 阅读 · 0 评论 -
小目标检测:CornerNet-Lite: Efficient Keypoint Based Object Detection
论文地址:https://arxiv.org/pdf/1904.08900代码地址:https://github.com/princeton-vl/CornerNet-Lite一、网络结构:网络结构描述不够清晰,论文里的描述不足以相像出架构:大段描述网络对大、中、小目标分别做了不同缩放以及用大小为3和1的卷积核,根本不知道结构是怎样的,幸好公布了代码。但是代码里并没有找到针对大、中、小目标的不同缩放,只是stack个分支网络,这也算?????关于convolution和residual,就原创 2020-07-17 00:17:17 · 228 阅读 · 0 评论 -
交通标志识别论文阅读(一)
交通标志数据集Tsinghua-Tencent 100KLISA Traffic Sign DatasetTsinghua-Tencent 100K在数据集 Traffic Sign Recognition on Tsinghua-Tencent 100K 上,只有一篇论文,其实这篇论文主要工作是数据集,在模型上,以faster rcnn为基础,添加了一个损失函数:这是faster rcnn原来的损失函数,即类别损失,加上位置回归的损失。本篇论文里的损失值:中间那行是子类的损失,如果预测出原创 2020-07-16 00:23:03 · 1648 阅读 · 0 评论 -
阅读笔记:The Devilis in the Details: Delving into Unbiased Data Processing for Human Pose Estimation
在paper with code里面,看了下姿态识别,找了最高的一篇论文,但是里面的公式推导太需要时间了,只看了其大致结构。另外,知乎这篇文章讲的更加简单透彻:魔鬼在细节中:人体姿态估计中无偏的数据处理方法。1.图片预处理时,可能会反转、旋转,以及在特征的提取过程中,会引起keypoint的偏移。2.本文就是处理这中偏移,用的公式有点多不过可以看出来,都是对关键点进行变换的。不明白的地方是,一个关键点坐标是(x,y),就算是b-box也是(x1,y1,x2,y2),为什么进行变换的时候用的是三原创 2020-07-13 21:46:37 · 2233 阅读 · 1 评论 -
阅读笔记:EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
在读上篇EfficientDet时,看到的EfficientNet,当时对其放缩网络感到疑惑,现在仔细看一下这个论文。论文链接:https://arxiv.org/pdf/1905.11946.pdf代码:https://github.com/lukemelas/EfficientNet-PyTorch论文很简明的说明了其思想:增加网络深度、宽度以及增大图像分辨率都可以提高准确率, 但是当增大到一定程度时,准确率提升非常缓慢,直至不再提升,甚至可能下降。作者认为,网络的深度、宽度以及分辨率之间存在着相互联原创 2020-07-13 00:00:38 · 247 阅读 · 0 评论 -
谷歌大脑刷新coco准确率 EfficientDet: Scalable and Efficient Object Detection
文章开头说,现在的检测网络,大的准确但是速度慢,速度快的精度低。而谷歌大脑的这篇论文,使用了EfficientNet作为backbone,再加上BiFPN,结合成了EfficientDet,这个模型现在是paper with code上coco数据集的第一名:其实解决的问题,是上篇目标检测中的不平衡问题中第五节规模不平衡(scale imblance)里说的特征不平衡(feature imblance)。即怎么有效且正确的利用各层特征,看这篇文章里列举的方法:d就是bifpn的结构,前三个有各自的问题原创 2020-07-11 23:46:37 · 308 阅读 · 0 评论 -
目标检测中的不平衡问题 open issues:Imbalance Problems in Object Detection: A Review
主要是四类不平衡,知乎介绍的很清楚。https://zhuanlan.zhihu.com/p/82371629现在说下open issues:这里作者并没有提出方法,只是跑出来一些疑问,这些疑问是待解决的问题。9.1 一般问题:先说a: 有两个正样本边界框(与类别不平衡相关),不同尺度(与尺度不平衡相关),损失值(与目标不平衡相关)和IoU(与BB,bounder box 不平衡相关)。再说b:将a的框稍微向右挪一点,成为b中的另外两个正样本边界框,但是IoU和Loss都改变了。这就导致:1原创 2020-07-10 22:29:26 · 770 阅读 · 0 评论 -
迭代FPN:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution
网络结构即将FPN输出做为backbone对应层的特征进行卷积,卷积后的结果输出到FPN,再与上次FPN输出的结果结合。给backbone和fpn定义符号,公式化说明:Bi代表在backbone的第i层卷积操作,xi是其卷积操作后的特征。Fi代表FPN的对xi操作,fi代表其池化后的结果。上面是递归前的FPN,图是递归操作,即x->backbone->FPN(0)(x+FPN(0))->backbone->FPN(1)FPN = FPN(0) + FPN(1)原原创 2020-07-09 15:52:55 · 2947 阅读 · 0 评论 -
小物体检测的有监督特征级超分辨方法 | ICCV 2019 : Better to Follow, Follow to Be Better
Better to Follow, Follow to Be Better: Towards Precise Supervision of FeatureSuper-Resolution for Small Object Detection论文地址:http://vision.snu.ac.kr/project_pages/iccv19_noh/data/iccv19_noh.pdf感受野:ARF、RRF、DRRF(1/2),分别代表感受野的大小,感受野与原图像大小的比值,原始图像与将原始图像缩小一半原创 2020-07-07 18:35:03 · 962 阅读 · 1 评论 -
Dynamic Region-Aware Convolution
旷视提出 DRConv:动态区域感知卷积,提升分类 / 检测 / 分割性能。《Dynamic Region-Aware Convolution》是2020年旷视在arXiv上的新论文,该论文实际上是在动态卷积(local形式)上引入了空间上的分组,从而显著提升了计算机视觉任务(分类检测分割)等性能,在云端实验还是非常值得尝试的。论文地址:https://arxiv.org/abs/2003.12243内容将图像划分成不同的区域,在不同的区域上使用不同的卷积。区域内卷积是通用的,不同区域卷积不通用。原创 2020-07-07 13:19:38 · 1675 阅读 · 0 评论