![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
目标检测
JLU-C++
本人目前研二在读,主要工作意向C++岗,不限位置
QQ:3152618907
展开
-
PIRL论文阅读
自监督学习不是特定的一种算法,而是一类算法,如word2vec,BERT,MOCO,PIRL等都属于自监督学习;和监督式机器学习一样,自监督学习训练时也需要features和labels,不同之处在于自监督学习的label不需要通过人为标记完成,而是自动生成的;自监督学习不针对特定应用场景,而是通用性预训练;主要看这篇知乎:https://zhuanlan.zhihu.com/p/108087827题目: 前置不变表示的自监督学习简称,PIRL:Pretext-Invariant Repr原创 2020-10-11 14:38:34 · 496 阅读 · 0 评论 -
G-FRNet论文阅读
主要参考这篇博客题目:用于密集图像标记的门控反馈优化网络G-FRNet:门控反馈优化网络Refinement:细化,优化所以要解决的问题:模糊信息的前向传递会限制后面的精准识别。下面给出论文中的示例:如PPT图所示例如,虽然网络中较深的卷积层可以在牛和马之间提供强大的区分力,但来自较早层的表示可能特定于动物图:跨层的接收场大小与可能出现的歧义之间关系的图示。在这种情况下,较大的(和更具区分性的)接收场(蓝色)位于网络的较深层,并且可能对于改进较早层(橙色)所承载的表示形式具有重要.原创 2020-10-11 14:32:02 · 492 阅读 · 3 评论 -
HTC论文阅读
题目: 混合任务级联MNC:多任务网络级联,COCO2015分割比赛冠军FCIS: 首个用于图像实例分割任务的全卷积、端到端的解决方案,该架构在 COCO 2016 图像分割竞赛中获得了第一名。PANet: CVPR2018关于实例分割(instance segmentation)的文章,既是COCO2017实例分割比赛的冠军,也是目标检测比赛的第二名。CC-Net:2019Cascade R-CNN:CVPR2018Deep Layer Cascade:2017 CVPRT.原创 2020-10-11 14:19:32 · 548 阅读 · 1 评论 -
DetectoRS论文阅读
题目:用递归特征金字塔和可切换Atrous卷积检测对象号称最强的目标检测网络:DetectoRS,拿下COCO实例分割并列第一(47.1%),COCO全景分割第一(49.6 AQ)目前COCO 目标检测霸榜的前三:DetectoRS、ResNeSt和CBNet都主要在backbone上面花了很大功夫!looking and thinking twice(无论是两阶段还是级联检测器,都体现出信息的反复利用和提精)要讲HTC,首先,来介绍一下Cascade RCNN接下来,来看HT.原创 2020-10-11 14:08:51 · 598 阅读 · 0 评论 -
AugFPN论文阅读
题目:改进多尺度特征学习用于目标检测FPN的三个缺陷也正好对应着这三个阶段:1. 特征混合之前我们知道,FPN在特征混合之前,backbone的不同stage学习到的特征需要先经过1*1卷积进行一个降维,降到通道数相同才能进行特征相加。然而不同stage学习到的特征感受野是不一样的,包含的语义信息也不同。把两个语义信息差距较大的特征直接相加,势必会减弱多尺度特征的表达能力简言之:特征求和前不同层次特征之间的语义差异2. 自顶向下的特征融合自顶向下的特征融合过程就是将顶层的高级特征和底层.原创 2020-10-11 13:53:26 · 361 阅读 · 0 评论 -
RefineDet论文阅读
题目:用于目标检测的单发细化神经网络对于物体检测,两阶段方法(例如,更快的R-CNN)已经实现了最高的准确性,而一阶段方法(例如,SSD)具有高效的优点。为了继承两者的优点并克服它们的缺点。RefineDet的主要思想:一方面引入two stage类型的object detection算法中对box的由粗到细的回归思想。另一方面引入类似FPN网络的特征融合操作用于检测网络,可以有效提高对小目标的检测效果,检测网络的框架还是SSD。由粗到细回归:其实就是先通过RPN网络得到粗粒度的box.原创 2020-10-11 13:03:25 · 265 阅读 · 0 评论 -
RFB论文阅读
题目:DSSD: Deconvolutional Single Shot Detector接收场块网,用于精确,快速的目标检测作为单阶段的检测方法,作者试图寻找速度和精度之间的平衡,就像之前很多single stage的方法一样,在精度近似甚至更优的情况下实现高速度。不过这篇文章的出发点很有趣,作者认为目前很多single stage的方法为了提高精度,会采用类似ResNet-101这样较深的网络,从而限制了效率。而手工设计的策略(注意是策略不是特征、这篇文章本质上还是CNN网络)相较于单纯.原创 2020-10-11 12:56:57 · 319 阅读 · 0 评论 -
MMDetection论文阅读+MMDetection运行
mmdetection的官方文档:https://mmdetection.readthedocs.io/en/latest/剩余的章节按照如下结构进行组织(主要就是三点内容)。首先,我们介绍了大量的已支持的方法并突出mmdetection的重要特征,然后,展示了基准测试结果。末尾,我们展示了一些可被选择的baseline的消融研究。这篇论文相当于一个技术报告题目:开放MMLab检测工具箱和基准背景介绍2d/3d目标检测的各个模块,误差函数,评价指标,以及线下数据集都是高度成熟和固定原创 2020-10-11 11:07:38 · 626 阅读 · 0 评论 -
SEPC论文阅读
题目:用于目标检测的金字塔尺度均衡卷积(简称SEPC)图像处理基础总结跨尺度相关性尺度不变性:就是我们在描述一个特征之前,将两张图像都变换到同一个尺度上,然后再在这个统一标准上来描述这个特征。(为了实现尺度不变性,需要给特征加上尺度因子。在进行特征描述的时候,将尺度统一就可以实现尺度不变性了。)注:尺度不变就是在特征点提取,或者匹配的时候,永远都把握好他就是那么大的存在,不会因为缩放把它变形。SIFT:尺度不变特征转换,用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取.原创 2020-10-10 20:14:05 · 1354 阅读 · 0 评论 -
YOLOv4论文阅读
Optimal:最优的题目:目标检测中最优的速度和精度YOLOv4总体上可以划分为两部分,一部分是讲Bag of freebies和Bag of Specials; 另外一部分讲的是YOLOv4的创新点。SOTA model:state-of-the-art model,并不是特指某个具体的模型,而是指在该项研究任务中,目前最好/最先进的模型。Bag of Freebies即在不改变模型结构并且不改变损失函数的情况下,不牺牲前向传播时间,将mAP提升近五个点。Bag-of-Special.原创 2020-10-10 19:58:35 · 215 阅读 · 0 评论 -
SSD论文阅读
Single shot指明了SSD算法属于one-stage方法,MultiBox指明了SSD是多框预测参考图中给出了不同算法的基本框架图,对于Faster R-CNN,其先通过CNN得到候选框,然后再进行分类与回归,而Yolo与SSD可以一步到位完成检测。相比Yolo,SSD采用CNN来直接进行检测,而不是像Yolo那样在全连接层之后做检测。这(采用卷积直接做检测)只是SSD相比Yolo的其中一个不同点,另外还有两个重要的改变,一是SSD提取了不同尺度的特征图来做检测,大尺度特征图(较靠前的.原创 2020-10-10 19:44:00 · 384 阅读 · 0 评论 -
YOLOv3论文阅读
YOLOv3增量的改进You Only Look Once:(创造性的将候选区和对象识别这两个阶段合二为一,看一眼图片(不用看两眼哦)就能知道有哪些对象以及它们的位置)说的是只需要一次CNN运算实战:使用yolov3完成肺结节检测(Luna16数据集)及肺实质分割:https://blog.csdn.net/qq_24739717/article/details/97112144从零开始实现YOLO v3(Part1):https://zhuanlan.zhihu.com/p/36899263.原创 2020-10-10 16:56:56 · 989 阅读 · 0 评论 -
YOLACT论文阅读
YOLACT:You Only Look At CoefficienTs (您只看系数),其中 coefficients 是这个模型的输出之一,这个命名风格应是致敬了另一目标检测模型 YOLO;Real-time:根据评估,当 YOLACT 处理 550*550 大小的图片时,其速度达到了 33FPS,而互联网上多数视频一般是 30FPS 的,这也就是实时的含义了;Instance segmentation:实例分割是一个目前很难的领域。在 semanitc segmentation 语义分割中,.原创 2020-10-10 16:38:25 · 334 阅读 · 0 评论 -
U-Net论文阅读
MICCAI是由国际医学图像计算和计算机辅助干预协会(Medical Image Computing and Computer Assisted Intervention Society) 举办,跨医学影像计算(MIC)和计算机辅助介入 (CAI) 两个领域的综合性学术会议,是该领域的顶级会议FCN的优点:1.是可以接受任意大小的输入图像,而不用要求所有的训练图像和测试图像具有同样的尺寸。2.更加高效,因为避免了由于使用像素块而带来的重复存储和计算卷积的问题U-Net是FCN的变体.原创 2020-10-09 18:24:21 · 208 阅读 · 0 评论 -
two-stage方法总结
这个two-stage是去年年前整理的PPT,仅供参考上图链接RCNN具体实现过程SSP-Net介绍题目:上图链接题目原创 2020-10-09 18:16:40 · 334 阅读 · 0 评论 -
Mask RCNN论文阅读
RCNN的一个大缺点:由于每一个候选框都要独自经过CNN,这使得花费的时间非常多。解决:共享卷积层,现在不是每一个候选框都当做输入进入CNN了,而是输入一张完整的图片,在第五个卷积层再得到每个候选框的特征引入了单层SSP Net的网络层,叫做ROI Pooling,这个网络层可以把不同大小的输入映射到一个固定尺度的特征向量,而我们知道,conv、pooling、relu等操作都不需要固定size的输入,因此,在原始图片上执行这些操作后,虽然输入图片size不同导致得到的feature ma...原创 2020-10-08 15:43:57 · 385 阅读 · 0 评论