输入为(2,64,32,32),输出为(2,64,64,64),对输入数据进行了上采样。
https://m.tb.cn/h.5KA7QdiJwMOsR8R
提出了一种新的超轻量级和有效的动态上采样器,称为DySample。作者绕过动态卷积,从点采样的角度制定上采样,资源效率更高,可以通过 PyTorch 中的标准内置函数轻松实现。本文讨论了最近基于内核的动态上采样器(如 CARAFE、FADE 和 SAPA)引入的工作负载问题,这主要是由于耗时的动态卷积和用于生成动态内核的附加子网络。DySample 不需要定制的 CUDA 包,与以前基于内核的动态上采样器相比,参数、FLOP、GPU 内存和延迟要少得多。