目标检测：PVAnet原理解析

最新推荐文章于 2021-01-11 19:43:39 发布

zhw864680355

最新推荐文章于 2021-01-11 19:43:39 发布

阅读量529

点赞数 1

分类专栏：深度学习 caffe

深度学习同时被 2 个专栏收录

58 篇文章 3 订阅

订阅专栏

21 篇文章 0 订阅

订阅专栏

原文：用于实时物体检测的深度轻量神经网络（PVANET：Deep but Lightweight Neural Networks for Real-time Object Detection）

论文链接：http://arxiv.org/pdf/1608.08021

Github：https://github.com/sanghoon/pva-faster-rcnn

C++ Demo：https://github.com/baiyancheng20/PVANet-Demo

原文链接：https://www.cnblogs.com/fariver/p/7449563.html

创新点：基于Faster-RCNN使用更高效的基础网络

1.1 创新点

PVAnet是RCNN系列目标方向，基于Faster-RCNN进行改进，Faster-RCNN基础网络可以使用ZF、VGG、Resnet等，但精度与速度难以同时提高。PVAnet的含义应该为：Performance Vs Accuracy，意为加速模型性能，同时不丢失精度的含义。主要的工作再使用了高效的自己设计的基础网络。该网络使用了C.ReLU、Inception、HyperNet以及residual模块等技巧。整体网络结构如图1所示。

2.1 C.ReLU

C.ReLU的作者观察基础网络卷积层参数，发现低层卷积核成对出现(参数互为相反数)，因此，作者减小输出特征图个数为原始一半，另一半直接取相反数得到，再将两部分特征图连接，从而减少了卷积核数目。关于C.ReLU参考博客与论文。C.ReLU的模块结构如图2所示。

2.2 Inception模块

作者发现googlenet中Inception模块由于具有多种感受野的卷积核组合，因此能够适应多尺度目标的检测，作者使用基于Inception模块组合并且组合跳级路特征进行基础网络后部分特征的提取。

2.3 HyperNet

将conv3中原图1/8特征图、conv3中原图1/16特征图、conv3中原图1/32特征图连接来增加最终特征图中多尺度信息。其中，conv3中特征图被下采样，conv5中特征图被线性插值上采样。如图1所示。

3.1 实验过程

除了以上基础网络的区别：

(1) PVAnet使用的anchor与faster-rcnn不同，PVA在每个特征点上使用了25个anchor(5种尺度，5种形状)。

(2) 并且RPN网络不使用全部特征图就能达到很好的定位精度，RPN网络只用生成200个proposals；

(3) 使用VOC2007、VOC2012、COCO一起训练模型；

(4) 可以使用类似于Fast-RCNN的truncated SVD来加速全连接层的速度;

(5) 使用投票机制增加训练精度，投票机制应该参考于R-FCN

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
目标检测：PVAnet原理解析

原文：用于实时物体检测的深度轻量神经网络（PVANET：Deep but Lightweight Neural Networks for Real-time Object Detection）论文链接：http://arxiv.org/pdf/1608.08021Github：https://github.com/sanghoon/pva-faster-rcnnC++ Demo：htt...
复制链接

扫一扫

专栏目录

zhw864680355 CSDN认证博客专家 CSDN认证企业博客

码龄7年

64: 原创

4万+: 周排名

220万+: 总排名

78万+: 访问

: 等级

6105: 积分

136: 粉丝

461: 获赞

82: 评论

2596: 收藏

私信

关注

热门文章

分类专栏

面试资料整理
c++ 3篇
机器学习 24篇
数据集 2篇
andorid 2篇
目标检测 19篇
行人检测 1篇
keras 5篇
Leetcode算法题 4篇
人脸检测 5篇
车牌识别 4篇
java 3篇
python 27篇
caffe 21篇
深度学习 58篇
爬虫
标注工具 1篇
轻量化网络 9篇
分类网络(BackBone) 6篇
opencv 18篇
ubuntu 3篇
flask 1篇
tensorflow 6篇

最新评论

OpenCV中文字的插入和字体的选择（包括大小）
Threonien: #include <opencv2/opencv.hpp>
flask无法访问(127.0.0.1:5000)的问题解决
?Mao???: 弄了一晚上终于好了，万分感谢
OpenCV中文字的插入和字体的选择（包括大小）
ProtectPigeons: using namespace cv;
机器学习之决策树算法：XGBoost、LightGBM和CatBoost
clrance: 因为LightGBM是用了leaf-wise的梯度提升算法，跟您文中所述容易过拟合，容易陷入深度较高的数据里面，所以要用params = {'max_depth' = 3 }，通常最大深度默认是-1，小于等于0都是属于无限制最大深度，我常用的调参是[3，5，7，9，12，15]，在信贷风控里面lightGBM是最快最好的，调整了最大深度就不会有过拟合情况了。具体参数还是需要自己调或者用深度算法自动调参。再弄一个损失函数去评估调参模型哈哈哈哈哈。
FastDFS：实现文件的上传、下载、修改、删除
qq_45886744: 这个modify不算修改吧，直接删掉文件，再传一个，都不是同一个文件了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。