作者发现可以将注意力模块分为两项:一个经过白化的成对项解释了两个像素之间的关系,一个一元项代表了每个像素的显著性。我们还观察到,单独训练的两项往往会为不同的视觉线索建模,例如白化的成对项学习区域内的关系,而一元项学习显著边界。然而,这两项在Non-Local块中紧密耦合,这妨碍了每项的学习。基于这些发现,我们提出了解耦的Non-Local块,其中两项解耦以促进所有项的学习。我们证明了分离设计在各种任务上的有效性,例如Cityscapes,ADE20K和PASCAL Context上的语义分割,COCO上的目标检测以及Kinetics上的动作识别。
解耦注意力模块,增益模型精度
最新推荐文章于 2024-05-06 13:46:28 发布