自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 【MAF-Net】用于遥感图像变化字幕的多尺度注意融合网络

大多数方法经常解决模型架构的缺点,以增强以前的工作,忽略了将遥感图像与自然图像分开的独特特征,例如识别不同尺度的对象的变化(例如,小/大尺度对象)。本文提出了一种多尺度注意力融合网络(MAF-Net),以自适应地捕获和描述大范围尺度的对象变化。目前的方法忽略了自然图像和遥感图像之间的显著特征,这限制了模型捕捉不同尺度物体变化的能力,生成较差的变化描述。遥感图像中尺度的多样性是由相机到物体距离的变化引起的自然特征,并导致图像中物体之间的尺度差异。

2024-09-09 16:04:20 1275

原创 【Lite Chag2cap】用于遥感图像变化描述的轻量化Transformer

RSICC旨在自动生成对遥感双时图像的差异描述,目前普遍用Transformer来捕捉全局变化特征基于Transformer的RSICC在Transformer解码器部分存在高参数量和计算复杂度的问题提出Sparse Focus Transformer,SFT网络由三部分构成:基于CNN的高级特征提取器,基于sparse focus attention mechanism的Transformer编码器(定位和捕捉双时图像变化区域),文本编码器。

2024-08-21 13:41:23 1352 1

flickr8k-train.json文件

flickr8k训练集 图像描述数据集

2023-03-30

flickr8k-val.json

flickr8k验证集json文件 图像描述数据集

2023-03-30

Flickr8k训练、验证、测试集json文件

图像描述数据集 Flickr8k

2023-03-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除