ShuffleMixer阅读

帅泽2000

已于 2024-05-22 18:57:25 修改

阅读量249

点赞数 1

文章标签：超分辨率重建

于 2024-05-20 17:40:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84052685/article/details/139022911

版权

2022年的文章

引言

很多网络高度依赖堆叠更深或更复杂的模型来扩大感受野以提高性能。因此，所需的计算预算使得这些重型 SR 模型难以在实际应用中部署在资源受限的移动设备上。

为了减轻繁重的SR模型，人们提出了各种方法来降低模型复杂性或加快运行时间，包括高效的操作设计，神经架构搜索、知识蒸馏和结构重新参数化方法。这些方法主要基于改进的小空间卷积或高级训练策略，而很少探索大核卷积。而且，它们大多关注效率指标之一，在实际资源受限的任务中表现不佳。

网络结构

上图为ShuffleMixer的网络结构。

有一些论文提到的细节在图上没有，比如特征提取是一个3*3卷积，为了节省上采样模块的参数，仅仅使用1*1卷积和pixel shuffling，对于*4scale factor，是进行两次*2上采样，最后的输出也很特别，是把上采样之后的SRImage与经过双线性插值处理的LRImage进行相加来输出，即

Feature Mixing Block由两个Shuffle Mixer Layer和一个FMBConv组成，Shuffle MixerLayer 由两个Channel Projection和夹在中间的大核Depthwise Convolution组成。Channel Projection引入了Channel splitting and shuffling 策略

Z0经过LN首先会被拆分通道为Z01和Z02，Z01将经过1*1逐点卷积，再与Z02合并进行Channel shuffling，最后与Z0相加输出。

学习策略

Lp是L1loss，入是权重参数，设置为0.1，F是快速傅里叶变换。

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
ShuffleMixer阅读

很多网络高度依赖堆叠更深或更复杂的模型来扩大感受野以提高性能。因此，所需的计算预算使得这些重型 SR 模型难以在实际应用中部署在资源受限的移动设备上。为了减轻繁重的SR模型，人们提出了各种方法来降低模型复杂性或加快运行时间，包括高效的操作设计，神经架构搜索、知识蒸馏和结构重新参数化方法。这些方法主要基于改进的小空间卷积或高级训练策略，而很少探索大核卷积。而且，它们大多关注效率指标之一，在实际资源受限的任务中表现不佳。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。