![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
2021年9月论文
YouLan999
眼里长着太阳,笑里全是坦荡;
做自己的太阳,无需凭借谁的光
展开
-
2018_CBAM__Convolutional Block Attention Module
标题Abstract:我们提出了卷积块注意模块,一个简单而有效的前馈卷积神经网络的注意力模型。给定一个中间特征映射,我们的模块沿着两个独立的维度(通道和空间)顺序推断注意映射,然后将注意映射乘以输入特征映射以进行自适应特征细化。因为CBAM是轻量级的通用模块,它可以无缝的集成到任何CNN架构中,开销可以忽略不计,并且可以与基础CNN一起进行端到端的训练。我们通过在ImageNet-1K数据集,MSCOCO检测数据集和VOC 2007检测数据集上的大量实验来验证我们的CBAM。我们的实验表明,各种模型在分原创 2021-10-14 11:22:20 · 137 阅读 · 0 评论 -
2018_SE_Squeeze-and-Excitation Networks
标题Abstract:卷积神经网络的核心构建模块是卷积算子,它使网络能够通过融合每层局部感受野中的空间和通道信息来构建信息特征。大量先前的研究已经调查了这种关系的空间成分,试图通过提高整个特征层次的空间编码质量来增强CNN的代表性。在这项工作中,我们将重点放在通道关系上,并提出了一种新的架构单元,我们称之为”挤压和激励“SE模块,它通过显式的建模通道间的互相依赖性,自适应的重新校准通道特征响应。我们表明,这些块可以堆叠在一起,形成SENet体系结构,在不同的数据集上非常有效的推广。我们进一步证明,SE块原创 2021-10-14 11:18:15 · 3223 阅读 · 0 评论 -
2021_BTH_Self-supervised Video Hashing via Bidirectional Tranformers
Abstract:现有的大多数无监督视频哈希算法是建立在单向模型上,训练目标不可靠,没有充分利用帧间的相关性和视频间的相似性结构。为了高效的可伸缩视频检索,我们提出了一种双向变换(Bidireactional Transformers Hashing,BTH)的自监督视频哈希方法。基于变换器的编解码结构,我们设计了一个视觉完形填空任务以充分利用帧间的双向相关性。为了揭示未标记视频数据之间的相似性结构,我们通过在视频空间中建立可靠的有效的相似性连接,进一步开发了相似性重建任务。此外,我们还开发了一个集群分原创 2021-09-25 09:07:08 · 600 阅读 · 0 评论