![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
目标检测
lpppcccc
这个作者很懒,什么都没留下…
展开
-
文本检测加识别:Mask TextSpotter
Framework(1)以特征金字塔网络(FPN)为骨干,提取feature map:自然图像中的文本大小各不相同。为了在所有尺度上构建高层次的语义特征图,我们使用了一个深度为50的ResNet[14]的特征金字塔结构[32]主干。FPN采用自顶向下的体系结构,融合了单尺度输入的不同分辨率特性,提高了精度,同时降低了边际成本。(2)区域建议网络(RPN)为生成文本建议(ROI):RPN用于...原创 2019-05-28 20:00:47 · 1126 阅读 · 0 评论 -
文本检测:Arbitrary-Oriented Scene Text Detection via Rotation Proposals(RRPN)
本文提出了一种基于文本倾斜角信息的旋转区域建议网络(RRPN)。然后利用角度信息进行包围盒回归,使提案在方向上更准确地融入文本区域。针对文本区域分类器的特点,提出了旋转感兴趣区域(RRoI)池化层,将任意方向的建议映射到特征图中。整个框架建立在基于区域的体系结构之上,与以往的文本检测系统相比,保证了任意文本检测的计算效率。框架(1)VGG-16作为主干网络卷积产生feature map;(2...原创 2019-05-21 09:24:18 · 763 阅读 · 0 评论 -
R2-CNN文本检测(Rotational Region CNN)
总体框架文章利用Faster R-CNN作为基本框架。(1)使用RPN生成轴向对齐的包围框,包围着面向任意方向的文本;(2)对RPN提出的每一个文本框,用不同的pooled size ( 7 × 7, 11 ×3, 3 × 11 ) 进行池化,并利用连接的特征同时预测文本/非文本得分、轴向对齐框和倾斜最小面积框。(3)最后,使用倾斜非最大抑制来获得检测结果问题定义在ICDAR 201...原创 2019-05-20 16:43:50 · 1014 阅读 · 0 评论 -
目标检测--NMS
NMS(non-maximum suppression)非最大值抑制,用于剔除图像中检出的冗余bbox。流程step-1:将所有检出的output_bbox按cls score划分(如pascal voc分20个类,也即将output_bbox按照其对应的cls score划分为21个集合,1个bg类,只不过bg类就没必要做NMS而已);step-2:在每个集合内根据各个bbox的cls s...转载 2019-11-07 16:51:13 · 403 阅读 · 0 评论 -
MTCNN
MTCNN,Multi-task convolutional neural network(多任务卷积神经网络),将人脸区域检测与人脸关键点检测放在了一起,它的主题框架类似于cascade。总体可分为P-Net、R-Net、和O-Net三层网络结构。网络结构级联网络,分三部分,网络由简单到复杂,逐步细化检测框。三个任务,分类,边框回归和关键点坐标。P-Net是一个全卷积网络,只不过最后一步...原创 2019-11-06 21:50:16 · 253 阅读 · 0 评论 -
论文阅读-Single-Shot Refinement Neural Network for Object Detection
two-stage 方法首先是候选区域的提取,然后是目标的分类和回归,这类方法的检测精度要好于 one-stage,但速度没有one-stage快;one-stage方法速度快,精度稍微差些,主要原因是 the class imbalance problem,即正负样本比例严重失调这篇论文实际就是将两者结合,主要就是增加了一个anchor细化的模块,一方面让anchor的质量更高,另一方面,两...原创 2019-05-16 18:41:01 · 229 阅读 · 0 评论 -
论文阅读:Region Proposal by Guided Anchoring
论文题目:Region Proposal by Guided AnchoringarXiv: https://arxiv.org/abs/1901.03278简单介绍这篇论文主要是对RPN存在的缺点的改进,说是改进也不准确,因为两者的方法是有很大区别的,但他们做的工作时相同的,都是为了得到候选区域。。本篇论文提出来一种新的方法,不需要使用预先设定的anchor box论文介绍RPN的...原创 2019-05-10 16:20:48 · 321 阅读 · 0 评论 -
Focal Loss(RetinaNet)论文阅读
这篇论文提出了Focal Loss(焦点损失),通过改进损失函数,从而获得更好地检测模型和更高的检测精度。Motivation(1)要清楚两个名词的含义;hard example,表示硬实例,比如二分类,正例为1,负例为0,那么训练过程中,预测结果接近0.5的,称为硬实例,通过硬实例,模型能学到更多有用的信息。easy example,与上面相反;(2)传统one-stage相对于t...原创 2019-05-14 20:52:13 · 454 阅读 · 0 评论 -
目标检测YOLO系列论文对比
yolo相对于R_CNN系列论文,创新之处在于不再需要候选区域,直接端到端,利用回归的思想,直接回归出边框和类别,大大加快了速度,同时精度也挺高。。YOLO v1...原创 2019-04-30 10:41:11 · 1806 阅读 · 0 评论 -
目标检测--SSD
SSD应该是和YOLO v2同一时期的论文,相比YOLO v1和RCNN系列,SSD借鉴了两者的优点,并加入了多尺度来弥补yolo在小物体检测的不足,在精度和速度上都超越了yolo v1。主要改进在于两点:(1)多尺度feature map增加鲁棒性,既能检测大物体,又能检测小物体,增加精度;(2)yolo使用全连接来预测,但是SSD采用卷积,保证速度。。网络结构1、base networ...原创 2019-05-01 17:15:12 · 240 阅读 · 0 评论 -
目标检测R-CNN系列对比
这里主要介绍一下R-CNN系列论文的大致思路。。包括训练的步骤,预测的步骤,以及每篇论文的新颖之处。R-CNN下面是r-cnn的流程图:训练过程1、输入一张带标签的图片,利用select-search方法,得到候选区域(region propossals,大约2000个)2、对每一个region propossal ,利用仿射图像扭曲(affine image wraping),将这...原创 2019-04-26 16:43:30 · 572 阅读 · 0 评论 -
目标检测-IOU
IOU为交并比,指的是两个bbox的交集面积比上他们的并集面积,用来评估两个bbox的重合度。。应用(1)在目标检测中,同一个目标可能被预测多个矩形框,这时候只想保留得分最高的那一个,需要剔除与高score bbox有较高重合度的低score bbox,而这里的重合度评估标准就是计算他们的IOU(2)对预测框性能评估时,评估指标为mAP(可以简单理解为精确度),我们要对预测正确的框计算mA...原创 2019-04-26 11:44:56 · 2154 阅读 · 0 评论