1. ELA介绍
1.1 摘要:注意力机制由于能够有效增强深度神经网络的性能而在计算机视觉领域获得了重要的认可。然而,现有的方法往往难以有效地利用空间信息,或者,如果它们这样做,它们的代价是减少通道维度或增加神经网络的复杂性。为了解决这些限制,本文介绍了一种高效的本地注意力(ELA)方法,实现了一个简单的结构,大幅度的性能改善。通过分析协同注意力方法的局限性,指出批量归一化方法泛化能力不足、降维对通道注意力的不利影响以及注意力生成过程的复杂性。为了克服这些挑战,我们提出了1D卷积和组归一化特征增强技术的结合。这种方法通过有效地编码两个1D位置特征图而无需降维,同时允许轻量级实现,从而实现感兴趣区域的准确定位。我们精心设计了ELA中的三个超参数,产生了四个不同的版本:ELA-T,ELAB,ELA-S和ELA-L,以满足不同视觉任务的具体要求,如图像分类,目标检测和语义分割。ELA可以无缝集成到深度CNN网络中,如ResNet、MobileNet和DeepLab。对ImageNet、MSCOCO和Pascal VOC数据集的广泛评估表明,在上述所有三个视觉任务中,所提出的ELA模