遥感图像检索(RS-CBIR)REJEPA: A Novel Joint-Embedding Predictive Architecture for Efficient Remote Sensing

论文作者:Shabnam Choudhury,Yash Salunkhe,Sarthak Mehrotra,Biplab Banerjee

作者单位:Indian Institute of Technology Bombay

论文链接:http://arxiv.org/abs/2504.03169v1

内容简介:

1)方向:遥感图像检索(RS-CBIR)

2)应用:遥感图像检索(RS-CBIR)

3)背景:随着遥感影像库的快速扩展,传统的基于内容的图像检索方法面临着计算复杂性和精度挑战。现有的生成方法多依赖像素重建,或通过对比学习依赖负样本对,这些方法在计算效率和检索准确性上存在局限性。因此,需要一种新方法来提高检索性能,同时降低计算复杂性。

4)方法:本文提出了一种创新的自监督框架REJEPA(Retrieval with Joint-Embedding Predictive Architecture),该框架旨在优化单一模态的遥感影像检索效率。REJEPA通过空间分布的上下文标记编码来预测目标标记的抽象表示,从而有效捕获高级语义特征,并去除不必要的像素级细节。与依赖像素重建的生成方法和负样本对的对比方法不同,REJEPA在特征空间内进行操作,结合了方差-不变性-协方差正则化(VICReg)以增强特征的多样性,减少冗余,并防止编码器崩溃。该方法在减少计算复杂性的同时,仍能确保强大且多样化的特征表示。

5)结果:实验证明,REJEPA在多个遥感数据集上显著提高了检索准确性,相较于现有的自监督学习方法,BEN-14K(S1)提高了5.1%,BEN-14K(S2)提高了7.4%,FMoW-RGB提高了6.0%,FMoW-Sentinel提高了10.1%。此外,与像素重建基准方法(如Masked Autoencoders)相比,REJEPA减少了40-60%的计算复杂性,证明了其在多传感器模态下的有效泛化能力,能够应对分辨率变化、高物体密度和复杂背景等挑战。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Qing_er爱吃山竹

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值