24’AAAI-Omni-Kernel Network for Image Restoration完全核形态的图像恢复网络文章概括

链接

原文:Omni-Kernel Network for Image Restoration| Proceedings of the AAAI Conference on Artificial Intelligence

代码:GitHub - c-yn/OKNet: [AAAI2024] Omni-Kernel Network for Image Restoration

创新性

本文创新性:1)在避免大量参数的情况下,合理的将卷积核(感受野)扩展到特征大小。2)对于推理时,输入图像大小不定,大感受野也不一定完全覆盖整个特征层,选择傅里叶变换后的频域信息,旨在完成细化全局内容。

结构

整体OKNet为类U-Net结构,ResGroup作为其中的基本模块,OKM作为U型结构的瓶颈的核心模块,具有巨大的卷积核(63*63)。

ResGroup:由多个残差块组成,每个残差块包括两个3×3卷积,中间是非线性激活GELU。

OKM(核心):分为三个分支(局部分支,大分支和全局分支),三个分支的结果然后通过加法融合,并通过另一个1×1卷积整合出结果。

大分支:我们应用核大小K×K的深度卷积来追求大的接受域。受基于strip的自注意,我们还使用1×K和K ×1深度卷积来获取strip形状的上下文信息。为了避免引入大量计算开销,我们将模块置于瓶颈处。然后,我们探索了通过逐步增加k来使用极大卷积进行图像恢复的可能性。一般来说,将核大小K增大,指标就会增大。训练所用的图片大小为256,在瓶颈处特征缩小到64大小,因此最终选择K=63。

全局分支:在推理阶段,输入的退化图像比训练的图像(256)大得多。因此,63 × 63内核无法覆盖全局图像。为了缓解这个问题,我们通过双域处理在全局分支中添加全局建模功能。其中,全局分支包括双域通道注意模块(DCAM)和基于频率的空间注意模块(FSAM),如图1。

傅里叶变换后的频域通过卷积便能感受到全局内容。这里的DCAM和FSAM的区别与之前的CBAM通道注意力/空间注意力机制类似。

局部分支:受局部信息在图像恢复中起重要作用这一事实的启发,除了捕获大规模感受野的外,一个非常简单但有效的局部分支,通过使用1 × 1深度卷积层进行局部信号整合。

ST-GCN神经网络是一种用于解决基于人体骨架关键点的人类动作识别问题的模型。它是通过引入图卷积网络的概念,将人体骨架关键点的时空信息结合起来进行动作识别的。这个网络模型是在香港中大-商汤科技联合实验室最新的AAAI会议论文中提出的,并且在标准的动作识别数据集上取得了较大的性能提升。 ST-GCN神经网络的关键点是利用图的邻接矩阵和单位矩阵来表示单帧内的骨骼点的链接。具体来说,在单帧内使用第一种划分策略的ST-GCN表示如下: fout=Λ−12(A I)Λ−12finW 其中,A表示图的邻接矩阵,I表示单位矩阵,fin表示输入特征,W表示权重矩阵。这种表示方式可以有效地捕捉到人体骨架关键点的时空关系,从而实现准确的动作识别。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [st-gcn时空图卷积神经网络](https://download.csdn.net/download/weixin_38635229/10842065)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [解读:基于动态骨骼的动作识别方法ST-GCN(时空图卷积网络模型)](https://blog.csdn.net/qq_36893052/article/details/79860328)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值