nips-day01

最新推荐文章于 2023-01-26 18:10:46 发布

lwycc233

最新推荐文章于 2023-01-26 18:10:46 发布

阅读量152

点赞数

分类专栏：论文

本文链接：https://blog.csdn.net/lwycc2333/article/details/85259201

版权

论文专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1. 卷积神经网络和CoordConv解决方案的一个有趣的缺陷

摘要
卷积对深度学习的影响之大，几乎没有其他思想能与之媲美。对于任何涉及像素或空间表示的问题，一般直觉认为卷积神经网络可能是合适的。

在本文中，我们通过看似微不足道的坐标变换问题展示了一个与这种直觉相反的突出例子，它仅仅需要学习(x，y)笛卡尔空间中的坐标与一个热点像素空间中的坐标之间的映射。虽然卷积网络似乎很适合这项任务，但我们发现它们失败得很惨。

我们首先演示并仔细分析一个玩具问题上的失败，在此情况下，一个简单的修复变得很明显。我们将这个解决方案称为CoordConv，它通过使用额外的坐标通道，使卷积能够访问自己的输入坐标。CoordConv在不牺牲普通卷积的计算和参数效率的前提下，允许网络根据最终任务的要求，学习完全平移不变性或不同程度的平移依赖性。CoordConv在参数比卷积少10-100倍的情况下，以完美的泛化和150倍的速度解决了坐标变换问题。

这种鲜明的对比提出了一个问题:在其他任务中，卷积的无能在多大程度上持续存在于其他任务中，微妙地妨碍了内部的性能?这个问题的完整答案需要进一步的研究，但是我们展示了初步的证据，用CoordConv交换卷积可以在不同的任务集上改进模型。在GAN中使用CoordConv可以减少模式崩溃，因为高级空间延迟与像素之间的转换变得更容易学习。训练MNIST检测的更快R-CNN检测模型显示，在使用CoordConv时，IOU提高了24%，在玩Atari游戏的强化学习(RL)域代理中，CoordConv层的使用显著受益。