SSD、Faster-rcnn Loss

最新推荐文章于 2021-01-28 11:30:53 发布

jiachen0212

最新推荐文章于 2021-01-28 11:30:53 发布

阅读量416

点赞数 1

分类专栏：目标检测文章标签：目标检测

本文链接：https://blog.csdn.net/jiachen0212/article/details/83960886

版权

目标检测专栏收录该内容

7 篇文章 0 订阅

订阅专栏

一点细节疑惑：

其中VGG16中的Conv4_3层将作为用于检测的第一个特征图。conv4_3层特征图大小是 $38\times38$ ，但是该层比较靠前，其norm较大，所以在其后面增加了一个L2 Normalization层（参见ParseNet），以保证和后面的检测层差异不是很大，这个和Batch Normalization层不太一样，其仅仅是对每个像素点在channle维度做归一化，而Batch Normalization层是在[batch_size, width, height]三个维度上做归一化。归一化后一般设置一个可训练的放缩变量gamma，使用TF可以这样简单实现：

def l2norm(x, scale, trainable=True, scope="L2Normalization"):
    n_channels = x.get_shape().as_list()[-1]
    l2_norm = tf.nn.l2_normalize(x, [3], epsilon=1e-12)
    with tf.variable_scope(scope):
        gamma = tf.get_variable("gamma", shape=[n_channels, ], dtype=tf.float32,
                                initializer=tf.constant_initializer(scale),
                                trainable=trainable)
        return l2_norm * gamma

来自知乎：ssd理解

这个在channel上的normalize是为了消除channel上差异的较大性嘛？因为层数较浅，即特征没有那么抽象，层之间的差异性较大，所以做个normalize？

jiachen0212

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SSD、Faster-rcnn Loss

一点细节疑惑：其中VGG16中的Conv4_3层将作为用于检测的第一个特征图。conv4_3层特征图大小是，但是该层比较靠前，其norm较大，所以在其后面增加了一个L2 Normalization层（参见ParseNet），以保证和后面的检测层差异不是很大，这个和Batch Normalization层不太一样，其仅仅是对每个像素点在channle维度做归一化，而Batch...
复制链接

扫一扫

专栏目录