Sydney遥感图像字幕数据集生成Resnet特征
1. 分析数据规模
Sydney-Captions 数据集是从 Google Earth 的悉尼数据集中收集和生成的[62]。每幅遥感图像都是从澳大利亚悉尼的一幅分辨率为 18,000 × 14,000 像素的遥感图像中裁剪而来,裁剪后的分辨率为 500 × 500 像素。Sydney-Captions 数据集的一些样本如图 6 所示。Sydney-Captions 数据集包含共 613 幅遥感图像,分为 7 个类别,如机场、海洋和工厂。该数据集使用 237 个不同词汇为每个遥感样本生成五个不同的描述标签。该数据集有更详细的描述语句,但问题在于遥感样本数量较少。下图展示了从 Sydney-Captions 数据集中选取的一些样本,包括工厂、草地、房屋、跑道等。Sydney-Captions 数据集包含了共七种场景的样本。每个遥感样本的尺寸为 500 × 500,并且格式为TIFF。
数据下载链接
:https://pan.baidu.com/s/1myAcltbnR8EkHn4IXymTYw?pwd=j4vx 提取