![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文
San_Junipero
这个作者很懒,什么都没留下…
展开
-
RCNN-论文+个人理解
论文内容摘要简介RCNN目标检测1 模块设计候选区域特征提取2 测试检测实时分析3 训练有监督预训练特定领域的微调fine-tuning目标分类器4 Results on PASCAL VOC 2010-12可视化对照试验与错误模型1学习特征可视化论文内容摘要在PASCAL VOC数据集上的目标检测性能表现,沉寂原创 2018-01-27 16:22:22 · 1126 阅读 · 0 评论 -
RCNN、Fast-RCNN、Faster-RCNN系列总结
目标检测,作为图像处理的进阶应用。相比于初级的分类,它还需要一个定位物体的过程。通过定位,分类的交替过程完成图片中的多目标检测。 对于定位。主要有两个路线。一,把定位问题看做一个回归问题,直接得到对象的坐标。如,YOLO系列中的五元组,(x,y,w,h,cls)。二,通过滑动窗口轮询的方式,进行定位,这就是RCNN系列region-based思路,这也方便将RCNN系列算法,扩展到语义分割领域。...原创 2018-07-27 09:52:11 · 1011 阅读 · 0 评论 -
Faster RCNN 论文小结
背景名词过程RPN问题背景原来写好的博客未保存消失了= =。按理解重新写一遍,可能会少内容,以后再补吧… RCNN系列称为region-based 方法,其准确率非常依赖于region proposal模块。这也是本文改进的重点内容。名词top:下一层名 bottom:上一层名 recall:【所谓召回率即候选区域为真的窗口与Ground...原创 2018-07-13 16:54:49 · 409 阅读 · 0 评论 -
SPP论文小结
名词问题为什么需要设计多种的滤波器,全联接的不行么CNN是怎么减少参数的为什么全连接层要求固定大小的输入CNN最成功的应用是在CV,那为什么NLP和Speech的很多问题也可以用CNN解出来?AlphaGo里也用了CNN。这几个不相关的问题的相似性在哪里?CNN通过什么手段抓住了这个共性?在训练师多尺度和在测试时多尺度有什么提升和进步full-view image repres...原创 2018-07-07 15:25:10 · 1408 阅读 · 0 评论 -
yolov2
YOLO缺点和rcnn系列相比,定位错误会多一些。毕竟是一步回归,难免准确率会下降一些。此外YOLO比基于region proposal的RCNN系列有更低的recall。recall即预测框和ground truth的比率。改进Batch normalize可以在不采用其他正则化方法的情况下,减小过拟合,并促进收敛。 其加在每一层的后面,把层间输出标准化。 可以...原创 2018-07-24 20:38:44 · 349 阅读 · 0 评论 -
Fast-RCNN小结
背景在之前的工作(RCNN和SPP)中,是通过提出大量候选框,把对象进行分类,再通过边界框回归,提高候选框定位精度。是多阶段的,速度慢且不优雅。之前的工作在训练过程要占用大量磁盘空间与GPU资源。SPP通过金字塔池化为全连接层提供了固定维度的特征,克服了输入尺寸的问题。但仍然需要把提出来的,共享的feature maps保存下来,作为cache留在磁盘上。这样经过边界框回归后,就可...原创 2018-07-12 16:49:52 · 368 阅读 · 0 评论 -
YOLOv1 待续
名词inception module问题bounding boxbounding box是怎么预测出来的。因为在博客里看到的一直是直接拿bounding box跟ground truth进行比较。损失函数对没有物体的栅格来说,其重要性远远不如有物体的栅格,但在损失函数中二者重要性如果一致,前者在梯度的贡献会淹没掉后者的贡献,虽然后者更有代表性。这会导致网络不稳定,乃至...原创 2018-07-16 18:42:00 · 489 阅读 · 0 评论 -
AlexNet论文--ImageNet Classification with Deep Convolutional Neural Networks总结
摘要我们的大型CNN网络模型能把ImageNet LSVRC-2010测试集上120万的高分辨率图片分到1000个不同的类别中。在top-1和top-5错误率上达到了37.5%和17.0%,比原来的 state-of-the-art好多了。 本神经网络有6000万个参数和650000个神经元,由五个卷积层组成,他们中的一部分后面跟着池化层,最后是全连接层,输出是一个1000类的softmax原创 2018-02-01 15:29:13 · 365 阅读 · 0 评论