1.CoordConv介绍
1.1 摘要:很少有思想像卷积一样对深度学习产生如此大的影响。对于任何涉及像素或空间表示的问题,通常的直觉认为卷积神经网络可能是合适的。在本文中,我们通过看似微不足道的坐标变换问题展示了这种直觉的一个引人注目的反例,该问题只需要学习(x,y)笛卡尔空间中的坐标与单热像素空间中的坐标之间的映射。虽然卷积网络似乎适合这项任务,但我们证明了它们会失败。我们首先在一个玩具问题上演示并仔细分析失败,此时一个简单的修复方法变得显而易见。我们将此解决方案称为CoordConv,其工作原理是通过使用额外的坐标通道来允许卷积访问其自己的输入坐标。在不牺牲普通卷积的计算和参数效率的情况下,CoordConv允许网络根据最终任务的要求学习完全的平移不变性或不同程度的平移依赖性。CoordConv解决了坐标变换问题,具有完美的泛化能力,比卷积快150倍,参数少10-100倍。这种鲜明的对比提出了一个问题:在多大程度上,这种卷积的无能一直隐藏在其他任务中,从内部微妙地阻碍了性能?这个问题的完整答案将需要进一步的研究,但我们展示了初步证据,即将卷积交换为CoordConv可以改进各种任务的模型。在GAN中使用CoordConv产生