引入
PVANET是韩国研究者(Intel Imaging and Camera Technology)结合了最新的技术,在TITAN X上实现了轻量级模型的实施目标检测任务,在PASCAL VOC上取得了第五名的成绩。
网络结构设计
C.Relu
作者为了减少网络参数,才用了C.ReLU[1]这一结构,最终能够使通道数减少一半。并在concat操作之后加入了尺度变化和偏移。具体结构如下:
从图上可以看出,作者其实只是将原本的Conv层,做了一个取反、尺度变化和漂移。具体的代码在power_layer.cpp/cu文件中。
加入尺度变化和偏移能够允许每一个通道的斜率和激活阈值与它们相反通道的不同。这样,也就是说,在一半的参数下,能够实现两倍的不同参数的filter。
Inception
作者也将近年来流行的Inception模型加入到了网络中来。
HyperNet
HyperNet[2]是今年CVPR上的论文,通过引入多尺度来增加对细节特征的提取。关于这部分,作者认为:因为直接对概要层连接可能会导致过多冗余信息,从而进一步加大了运算量,因此需要仔细地设计不同概要层的数量和层数。如果过早,只有很小的提升,但可能会引起过多的计算。
最终&#x