Tensorflow的LRN是怎么做的

最新推荐文章于 2021-02-07 22:45:14 发布

LeadAI学院

最新推荐文章于 2021-02-07 22:45:14 发布

阅读量988

点赞数

上海站 | 高性能计算之GPU CUDA培训

4月13-15日

三天密集式训练快速带你晋级

阅读全文

正文共1699个字，2张图，预计阅读时间5分钟。

LRN全称是local response normalization，局部响应归一化，想了解原理的点这个AlexNet（http://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks）。

看了Alex写的论文，里面介绍了LRN，稀里糊涂的，第一遍根本没看懂，于是我就想，先看看tensorflow怎么做的LRN吧，然后我就看明白了，但我貌似讲不太明白。。。。首先，公式是这样的：

LRN

其次，官方API的介绍是这样的：

sqr_sum[a, b, c, d] = sum(input[a,b, c, d - depth_radius : d + depth_radius + 1] ** 2) output = input / (bias +alpha * sqr_sum) ** beta

以alexnet的论文为例，输入暂且定为 [batch_size, 224, 224, 96]，这里224×224是图片的大小，经过第一次卷积再经过ReLU，就是LRN函数的输入。

注意上面API说明里的sum函数，意思就是，可能解释起来比较拗口，针对batch里每一个图的后3维向量，[224, 224, d - depth_radius : d + depth_radius + 1]，对它按照半径 depth_radius求每个图里的每个像素的平方，再把这2× depth_radius+1个平方过后的图片加起来，就得到了这个batch的sqr_sum。

不得不说，上面一段解释太差强人意了，貌似还不太对，于是我又思考了一下，从新解释，顺便给出一个小程序以验证，程序如下：

import numpy as npimport tensorflow as tf a = 2 * np.ones([2, 2, 2, 3]) b = tf.nn.local_response_normalization(a, 1, 0, 1, 1) sess = tf.Session()print sess.run(b)

为了简化，上面的程序中令depth_radius=1，bias=0，alpha=1，beta=1，这样算出的结果就相当于：

output = input / sqr_sum

实际运行的结果是这样的：

# a的原始值

array([[[[ 2., 2., 2.],

[ 2., 2., 2.]],

[[ 2., 2., 2.],

[ 2., 2., 2.]]],

[[[ 2., 2., 2.],

[ 2., 2., 2.]],

[[ 2., 2., 2.],

[ 2., 2., 2.]]]]