【ACMMM2024】Multi-Scale and Detail-Enhanced Segment Anything Model for Salient Object Detection

论文:https://arxiv.org/abs/2408.01276

代码:https://github.com/AlexZou14/Wave-Mamba

这个论文的主要研究动机就是把Mamba应用于超高分辨率暗光图像增强(UHD LLIE)。首先,作者描述两个现象:

  • In the wavelet domain, most image information resides in the low-frequency component, with only a minor portion of texture information in the high frequency component.
  • High-frequency information has a minimal impact on the results of LLIE.

因此,作者构建建的目标是增强低频信息,利用增强的低频信息调整高频信息,节省计算资源。作者提出的模型整体框架如下图所示,个人感觉和Restormer特别像。作者的改进主要是加入了小波变换,同时设计了两个关键模块:low-frequency state space block (LFSSBlock) 和 high-frequency enhance block (HFEBlock),下面将分别介绍。

image-20240829075313470

low-frequency state space block (LFSSBlock): 特征经过DWT以后,低频部分输入到LFSS,是一个典型的 attention+FFN 的结构,只不过 attention 部分使用 SSM 替换

high-frequency enhance block (HFEBlock): HFE如下图所示,也是类似 attention + FFN 的结构,两个阶段都使用FMT融合高低频特征。不过作者认为Q对于结果的影响更大,融合特征时FMT应用于Q了。同时,在FMT模块内部,Q也是低频特征。FMT非常类似于 cross-attention,在计算相似性矩阵时,使用了一个 TOP-1 selection 的操作。

image-20240829075907848

实验部分可以参考作者论文,这里不过多介绍。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值