模型
文章平均质量分 89
金小虾
请叫我静静!
展开
-
基本概念——SPP (空间金字塔池化)
SPP 在 SPP-net 中的应用:SPP-net全名为Spatial Pyramid Pooling 结构(空间金字塔池化结构),2015年由微软研究院的何恺明提出。主要解决两个问题:有效避免了R-CNN算法对图像区域剪裁、缩放操作导致的图像物体剪裁不全以及形状扭曲等问题。解决了卷积神经网络对图像重复特征提取的问题,大大提高了产生候选框的速度,且节省了计算成本。问题1具体解释:在含有全连接层的分类网络中,严格要求输入分辨率和全连接层的特征维度相匹配。所以就会对图像进行裁剪和变形操作,也原创 2021-01-01 15:49:33 · 7592 阅读 · 3 评论 -
目标检测 | YOLOV1
参考: 目标检测|YOLO原理与实现.一、两大类目标检测算法:(1)two-stage:基于Region Proposal的R-CNN系算法(R-CNN,Fast R-CNN, Faster R-CNN),它们是two-stage的,需要先使用启发式方法(selective search)或者CNN网络(RPN)产生Region Proposal,然后再在Region Proposal上做分类与回归。**优缺点:**准确度高一些,但是速度慢,无法满足实时应用。(2)one-stage而另一类是Y转载 2020-08-31 22:38:43 · 693 阅读 · 0 评论 -
Faster R-CNN
Faster R-CNNRPN没搞懂为什么要分成两路?18是什么?36是什么?如何获得proposal?每个网格获得9个anchors之后应该怎么再精选?遍历Conv layers计算获得的feature maps,为每一个点都配备这9种anchors作为初始的检测框。这样做获得检测框很不准确,不用担心,后面还有2次bounding box regression可以修正检测框位置。为什么数值是这么大呢?下面一条用于计算对于anchors的bounding box regression偏移原创 2020-08-24 19:48:12 · 404 阅读 · 0 评论 -
SPP
SPP(Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition)https://blog.csdn.net/yzf0011/article/details/75212513https://blog.csdn.net/qq_35451572/article/details/80273222https://blog.csdn.net/bryant_meng/article/details/78615353原创 2020-08-18 12:04:55 · 784 阅读 · 0 评论 -
区域卷积神经网络R-CNN
区域卷积神经网络R-CNNR-CNN的全称是Region-CNN,是第一个成功将深度学习应用到目标检测上的算法。R-CNN基于卷积神经网络(CNN),线性回归,和支持向量机(SVM)等算法,实现目标检测技术。原创 2020-08-16 17:43:09 · 1362 阅读 · 0 评论 -
目标检测详细概括
目标检测(1)概念:检测图片中所有物体的类别标签==(Category label)和位置(最小外接矩形/Bounding box)==(2)与其他任务的区别:**单例任务:**分类、分类&定位**多例任务:**物体检测、实例分割==(最难,要确定像素属于哪类)==(3)相关著名比赛ImageNet Large Scale Visual Recongnition Challenge这个比赛的项目包括: 1. 图像分类2. 物体检测3. 场景分类4. 物体定位5. 场景解析原创 2020-08-13 19:43:47 · 326 阅读 · 0 评论 -
迁移学习和Fine Tuning
https://arxiv.org/pdf/1411.1792.pdf迁移学习transfer learning的概念:打破深度学习需要大量的训练数据的传统观念,其实我们可以站在巨人的肩膀上,借助预训练好的模型,泛化到自己的数据集上,如下图。注:冻结模型的意思是在训练的时候保持参数不变1、迁移学习的几种情况:(1)如果数据集很小,同时与原数据集很相似,我们只要对数据集的最后线性分类层进行修改就行(2)如果数据集很小,同时与原数据集不同,我们不需要高层卷积层,因为高级卷积层提取的是原数据集的特.原创 2020-08-12 17:02:08 · 315 阅读 · 0 评论 -
经典神经网络结构案例分析
经典神经网络结构案例分析(1)LeNet-5(1998)(2)AlexNet(2012)注:在AlexNet提出的那个年代,还没有GPU,所以用的是CPU进行并行计算2.1 几种AlexNet的几种形象表示:![在这里插入图片描述](https://img-blog.csdnimg.cn/2020081018513327.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9i原创 2020-08-11 20:09:13 · 1287 阅读 · 0 评论 -
AlexNet
ImageNet Classification with Deep Convolutional Neural NetworksFull(Simplified) AlexNet architecture:[277x277x3] INPUT[55x55x96] CONV1:96层、11x11卷积核、步长为4、pad为0[27x27x96] MAX POOL1:3x3卷积核、步长为2[27x27x96]NORM1:Normalization layer[27x27x256] CONV2:256通道 、原创 2020-09-21 19:31:39 · 172 阅读 · 0 评论 -
SSD(ECCV 2016)
SSD的英文全名是Single Shot MultiBox Detector,Single shot说明SSD算法属于one-stage方法,MultiBox说明SSD算法基于多框预测。SSD是一种非常优秀的one-stage目标检测方法,one-stage算法就是目标检测和分类是同时完成的,其主要思路是利用CNN提取特征后,提取不同大小的特征层,均匀地在图片的不同位置进行密集抽样,抽样时可以采用不同尺度和长宽比,物体分类与预测框的回归同时进行,整个过程只需要一步,所以其优势是速度快。但是均匀的密集采样原创 2020-09-20 16:16:13 · 634 阅读 · 1 评论