[深度而学习从入门到女装]Non-local Neural Networks

最新推荐文章于 2022-01-12 21:24:32 发布

炼丹师

最新推荐文章于 2022-01-12 21:24:32 发布

阅读量1.4k

点赞数 2

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/py184473894/article/details/85322937

版权

深度学习专栏收录该内容

126 篇文章 11 订阅

订阅专栏

论文地址：Non-local Neural Networks

代码地址：https://github.com/facebookresearch/video-nonlocal-net

本文是CVPR2018的一篇poster，来自Facebook

传统的卷积都只是在局部进行操作，无法得到更多的上下文信息，因此本文根据传统的non-local means method提出了使用卷积的Non-local Neural Networks

传统的卷积如果想要得到long-range dependency，需要重复多次local操作，没有效率，也很困难，因此提出了non-local方法作为一种简单的方法是来得到long-range dependency，并且可以添加到多种卷积模块中

Non-local means [4] is a classical filtering algorithm that computes a weighted mean of all pixels in an image.

Long-range dependencies can be modeled by graphical models such as conditional random fields (CRF) [29, 28].

A selfattention module computes the response at a position in a sequence (e.g., a sentence) by attending to all positions and taking their weighted average in an embedding space.

non-local block

non-local operation的数学表达式：

f用来度量输出位置和周围其他位置的尺度，g是在位置j对于输入信号的表示（在本文中为卷积操作）

对于non-local behaiver来说，上式中的j是取遍所有可能的邻居，而对于local操作，如3*3的卷积来说，j只是取了周围8个像素点，如递归卷积来说，j只是取了前一个和后一个time

对于g来说，只考虑为，W为需要学习的参数，使用1*1卷积，或者1*1*1卷积来实施

主要讨论f，一种列了四种f

1、Gaussian

2、Embedded Gaussian.

3、Dot product.

4、Concatenation.

整个模块如上，X为输入，Z为输出，首先把X为T*H*W*1024copy为三份，分别进行三条路，以Embedded Gaussian为例进行介绍

1、 $\theta$ 使用1*1*1卷积对X进行降维成T*H*W*512，然后进行reshape到THW*512，相当于进行操作

2、 $\phi$ 使用1*1*1卷积对X进行降维成T*H*W*512，然后进行reshape到512*THW，相当于进行操作

然后对1和2得到的结果进行矩阵相乘得到THW*THW的结果，相当于进行操作，然后进行softmax操作，相当于进行

3、使用1*1*1卷积对X进行降维成T*H*W*512，然后进行reshape到THW*512，相当于进行操作

然后把1和2进行矩阵相乘经过softmax的结果和3得到的结果进行矩阵相乘得到THW*512，相当于进行

最后使用1*1*1卷积将上一步得到的结果THW*512成为T*H*W*1024

然后这个结果和x相加，形成一个residual block

non-local block用于high-level, sub-sampled feature maps，T = 4, H = W = 14 or 7.

为了减少计算量，可以使用pooling对x进行采样操作

Video Classification Models

2D ConvNet baseline (C2D).

参考：https://blog.csdn.net/u014380165/article/details/80011785

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
[深度而学习从入门到女装]Non-local Neural Networks

论文地址：Non-local Neural Networks代码地址：https://github.com/facebookresearch/video-nonlocal-net 本文是CVPR2018的一篇poster，来自Facebook 传统的卷积都只是在局部进行操作，无法得到更多的上下文信息，因此本文根据传统的non-local means method提出了使用卷积的...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。