论文笔记:PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection

PVANET是Intel Imaging团队提出的一种轻量级深度学习模型,用于实时目标检测。通过C.ReLU、Inception和HyperNet模块设计,它在减少参数数量的同时保持高性能。在PASCAL VOC上,该模型展示了高效和准确的检测能力,每张图像仅需46ms。相比YOLO和SSD,PVANET在实验中表现出更好的可靠性。
摘要由CSDN通过智能技术生成

引入

PVANET是韩国研究者(Intel Imaging and Camera Technology)结合了最新的技术,在TITAN X上实现了轻量级模型的实施目标检测任务,在PASCAL VOC上取得了第五名的成绩。

网络结构设计

C.Relu

作者为了减少网络参数,才用了C.ReLU[1]这一结构,最终能够使通道数减少一半。并在concat操作之后加入了尺度变化和偏移。具体结构如下:

从图上可以看出,作者其实只是将原本的Conv层,做了一个取反、尺度变化和漂移。具体的代码在power_layer.cpp/cu文件中。
加入尺度变化和偏移能够允许每一个通道的斜率和激活阈值与它们相反通道的不同。这样,也就是说,在一半的参数下,能够实现两倍的不同参数的filter。

Inception

作者也将近年来流行的Inception模型加入到了网络中来。

HyperNet

HyperNet[2]是今年CVPR上的论文,通过引入多尺度来增加对细节特征的提取。关于这部分,作者认为:因为直接对概要层连接可能会导致过多冗余信息,从而进一步加大了运算量,因此需要仔细地设计不同概要层的数量和层数。如果过早,只有很小的提升,但可能会引起过多的计算。

最终&#x

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值