目标检测
文章平均质量分 57
沐昐boy
我很懒,还没添加简介
展开
-
SSD算法学习
R-CNN系列目标检测精度高但是检测速度较慢,YOLO检测速度快但是精度不够,SSD对YOLO检测速度方面做了一些改进。原创 2021-06-03 16:47:12 · 95 阅读 · 0 评论 -
特征金字塔FPN学习
FPN通过利用常规CNN模型内部从底至上各个层对同一scale图片不同维度的特征表达结构,提出了一种可有效在单一图片视图下生成对其的多维度特征表达的方法。通过图像金字塔来构建不同尺度的特征金字塔。能够产生多尺度的特征表示,但是推理时间会大幅度增加,内存消耗会增加。利用某个高层特征进行预测特征金字塔,即使每一层不同尺度的特征图都具有较强的语义信息。FPN是在以特征金字塔为基础结构上,对每一层级的特征图分别进行预测。C5层先经过1 x 1卷积,改变特征图的通道数得到M5,M5上采样再加上C4经原创 2021-06-02 11:37:16 · 309 阅读 · 0 评论 -
Mask R-CNN学习
Mask R-CNN是以Faster R-CNN为原型,增加了一个分支用于分割任务与Faster R-CNN的不同之处:对于每个Proposal Box使用FCN进行语义分割。引入ROI Align代替ROI Poling。引入语义分割分支FCN(Fully Convolutional Networks)CNN进行语义分割只能提取一下局部特征,无法确定像素区域,而且计算量较大。用全卷积层代替全连接层以保持维数,用于语义分割。ROI Align因为ROI Poling对于mask来说很影原创 2021-06-02 10:47:35 · 106 阅读 · 0 评论 -
YOLO学习
参考https://zhuanlan.zhihu.com/p/25236464/YOLO训练和检测均是在一个单独网络中进行,没有显示地求取region proposal的过程。整体框架共24个卷积层和2个全连接层,卷积层用来提取图像特征,全连接层用来预测图像位置和类别概率值。YOLO输出定义YOLO将输入图像分成SxS个格子,若某个物体的中心位置的坐标落入到某个格子,那么这个格子就负责检测出这个物体。每个格子输出B个bounding box(包含物体的矩形区域x,y,w,h,和confidenc原创 2021-06-01 21:24:51 · 295 阅读 · 0 评论 -
Faster RCNN解读
首先需要了解RCNN和Fast RCNNR-CNN的主要思路:给定一张输入图片,从图片中提取 2000 个类别独立的候选区域,用Selective Search算法,这是一种遍历搜索的方式。对于每个区域利用 CNN 抽取一个固定长度的特征向量,无视候选框大小不一样,统一变换。再对每个区域利用 SVM 进行目标分类。R-CNN存在以下几个问题:1、训练分多步。R-CNN的训练先要fine tuning一个预训练的网络,然后针对每个类别都训练一个SVM分类器,最后还要用regressors对bo原创 2021-06-01 19:25:52 · 1143 阅读 · 1 评论 -
ROI Polling学习
ROI Polling是Faster RCNN公共Feature Map层的另一个输出。ROI Polling是对RPN获取的大小不一的anchors进行池化,池化成大小相同的feature map原创 2021-05-31 22:53:50 · 352 阅读 · 0 评论 -
区域生成网络(RPN)学习
参考https://blog.csdn.net/qq_36269513/article/details/80421990anchors锚如下图,对于该图像每个位置,考虑9个候选窗口,这些候选窗口成为anchors。表示预先在可能出现的位置画框,后续方便筛选。每个anhcor要分foreground和backgroundRPN运行机制在Faster RCNN中,RPN的作用如下图:一个特征图经过sliding window处理(即3*3卷积),得到256维特征,然后通过两次全连接得到结果2k原创 2021-05-31 19:20:31 · 478 阅读 · 0 评论