- 博客(9)
- 资源 (7)
- 收藏
- 关注
转载 神经网络的认识(十二)Mask-RCNN
Mask-RCNN 的网络结构示意:其中 黑色部分为原来的 Faster-RCNN, 红色部分为在 Faster 网络上的修改:1) 将 Roi Pooling 层替换成了 RoiAlign;2) 添加并列的 FCN 层(mask 层);先来概述一下 Mask-RCNN 的几个特点(来自于 Paper 的 Abstract):1)在边框识别的基础上添加分支网络,用于 语义 Mask 识...
2019-06-09 09:35:38 3009
转载 神经网络的认识(十一)R-FCN
顾名思议:全卷积网络,就是全部是卷积层,而没有全连接层(fc)。R-FCN(基于区域的检测器)的方法是:在整个图像上共享计算,通过移除最后的 fc 层实现(即删除了所有的子网络)。使用“位置敏感的得分图”来解决了图像分类平移不变性与对象检测平移变化之间的矛盾。矛盾在于:物体分类要求平移不变性越大越好 (图像中物体的移动不用区分),而物体检测要求有平移变化。所以,ImageNet 分类领先的结果...
2019-06-08 20:12:32 574
转载 神经网络的认识(十)Faster R-CNN
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks在 Region Proposal +CNN 分类的这种目标检测框架中, Region Proposal 质量好坏直接影响到目标检测任务的精度。如果找到一种方法只提取几百个或者更少的高质量的假选窗口,而且召回率很高,这不但能加快目标检测速度,...
2019-06-08 15:07:57 1594
转载 神经网络的认识(九)Fast R-CNN
框架如此与 R-CNN 框架图对比, 可以发现主要有两处不同: 一是最后一个卷积层后加了一个 ROI pooling layer, 二是损失函数使用了多任务损失函数(multi-task loss), 将边框回归直接加入到 CNN 网络中训练。ROI pooling layer 实际上是 SPP-NET 的一个精简版, SPP-NET 对每个 proposal 使用了不同大小的金字塔映射,...
2019-06-08 14:00:08 772
转载 神经网络的认识(八)SPP-NET
SSP-Net: Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition先看一下 R-CNN 为什么检测速度这么慢, 一张图都需要 47s! 仔细看下 R-CNN 框架发现, 对图像提完 Region Proposal(2000 个左右) 之后将每个 Proposal 当成一张图像进行后续处理...
2019-06-08 09:32:29 1412
转载 神经网络的认识(七)R-CNN
R-CNNRegion Proposal候选区域(Region Proposal)候选区域选择CNN 特征提取分类与边界回归Region Proposal可以解决滑动窗口的问题候选区域(Region Proposal)是预先找出图中目标可能出现的位置。它利用了图像中的纹理、边缘、颜色等信息,可以保证在选取较少窗口(几千甚至几百)的情况下保持较高的召回率(Recall)。RCNN(Regi...
2019-06-07 21:22:03 5356
原创 神经网络的认识(六)AlexNet、VGG、ResNet模型
AlexNet 模型ImageNet Classification with Deep Convolutional Neural Networks 是Hinton和他的学生Alex Krizhevsky在12年ImageNet Challenge使用的模型结构,刷新了Image Classification的几率,从此deeplearning在Image这块开始一次次超过state-of-ar...
2019-06-07 14:03:43 1739
原创 神经网络的认识(五)Inception-v3 模型
Inception-v3 模型Inception 结构是一种和LeNet-5 结构完全不同的卷积神经网络结构。在 LeNet-5 模型中,不同卷积层通过串联的方式连接在一起,而 Inception-v3 模型中的Inception 结构是将不同的卷积层通过井联的方式结合在一起。一个卷积层可以使用边长为 1 、3 或者 5 的过滤器,那么如何在这些边长中选呢? Inception 模块给出...
2019-06-04 19:17:04 4667
原创 神经网络的认识(四)LeNet-5 模型
LeNet-5模型第一层,卷积层第二层,池化层第三层,卷积层第四层,池化层第五层,全连接层第六层,全连接层第七层,全连接层LeNet-5 模型是 Yann LeCun 教授于1998 年再论文Gradient“based learning applied to document recognition中提出的,它是第一个成功应用于数字识别问题的卷积神经网络。第一层,卷积层这一层的输入就...
2019-06-04 17:53:43 1381
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人