本文提出了一种名为WaveMixSR的资源高效神经网络,专门用于图像超分辨率处理。WaveMixSR基于WaveMix架构,采用二维离散小波变换来进行空间混合,这一方法不同于传统将图像展开为像素或块序列的变换器模型。该网络通过结合卷积的内在偏差和小波变换的无损混合性质,在减少计算资源需求的同时,提高了性能并减少了训练数据的需求。研究中对比了WaveMixSR与其他最新图像超分辨率方法的性能,结果显示WaveMixSR在所有测试数据集上都表现出了竞争力,并在BSD100数据集上达到了顶尖水平,特别是在多种超分辨率任务中。该模型不仅在有限的数据和计算资源下达到了高参数效率,还能在保持安全性的前提下处理繁重任务,特别是在人机交互环境中。
WaveMixSR的具体设计中,对于两倍放大(2× SR),首先通过无参数上采样层将低分辨率(LR)图像的Y通道特征图放大到高分辨率(HR)。对于3倍和4倍放大,会使用相应的上采样模块。上采样后的输出再经过卷积层增加特征图数量,然后通过四个串联的WaveMix块来生成高分辨率特征图。WaveMix块使用单级二维离散小波变换(2D-DWT),它不降低特征图的空间分辨率,同时通过减少空间维度来降低计算量,这直接转化为GPU内存、训练时间和推理时间的减少。最终,WaveMix块输出经过卷积层减少通道数并转换回单一通道输出,与通过简单上采样的CbCr通道连接,共同构成最终的YCbCr输出,再转换为RGB色彩空间得到高分辨率图像。
综上所述&#x