梯田农业在山区发挥着至关重要的作用,可以防止水土流失,优化土地利用,并支持当地生态系统。然而,由于缺乏统一的自动识别模型,对梯田全球分布的研究有限。尽管近年来深度学习架构发展迅速,但它们在提取梯田地图方面的表现仍需进一步研究。
为了解决这一局限性,本研究比较了八种最先进的深度学习模型的性能,包括 UNet、HRNet、DeepLabv3+、TransUNet、Segmenter、PVT v2、Swin-Unet 和 PerSAM。Sentinel-2 影像因其光谱特性而被选中,而数字高程模型 (DEM) 影像则因其详细的地形信息而被选中。UNet 在梯田识别方面的表现优于其他模型,总体准确率达到 92.8%,平均交并比 (MIoU) 达到 75.9%。整个数据处理工作流程使用 Google Earth Engine 进行数据采集、Google Drive 进行存储、Google Earth Pro 提供计算能力以及云计算资源中的 T4 GPU,大约需要 625 小时。
最终生成了 2022 年 10 米分辨率的全球梯田地图 (GTM)。梯田总面积估计为 853,161 平方公里,约占全球耕地面积的 5.1%。已确定梯田面积最大的国家是中国(298,908 平方公里,占耕地总面积的18 %)、埃塞俄比亚(127,266 平方公里,47%)、肯尼亚(36,385 平方公里, 37%)、印度(34,485 平方公里, 2%)和刚果民主共和国(31,422 平方公里, 21%)。
预计这一开创性的全球梯田地图将弥补弹性农业领域的巨大数据缺口。它将为了解梯田农业系统的空间分布和属性以及其在加强粮食安全和促进环境可持续性方面的作用提供宝贵的见解。
中国科学院空天信息创新研究院(空天院)CropWatch团队突破了复杂梯田遥感智能提取技术,利用云计算平台与深度学习技术,研发首套全球10米分辨率的梯田分布图(GTM)。
选择最佳模型
研究团队考虑到全球梯田的差异性和多样性,研究评估了8种深度学习模型,包括卷积神经网络模型、视觉Transformer模型、混合模型和语义分割大模型等,以确定梯田识别的最佳模型,进一步将最优模型应用于Google Colab Pro +云计算平台,实现梯田精准提取。
图1 全球梯田提取流程图
收集大量样本
为了确保模型的准确性和可靠性,并考虑梯田受到地形、气候条件、农业技术等因素影像,以及在不同地区的形态、结构和用途上存在差异,研究团队共收集了108,300个训练样本,包含被列入全球重要农业遗产系统联合国教科文组织世界遗产地的梯田景观,从而保证训练样本的多样性和代表性,增强模型在不同景观中的泛化能力。
图2 样本分布图及代表性梯田图
研发全球10米分辨率梯田分布数据集(GTM)
基于上述研究工作,研究团队发布全球10米分辨率的梯田分布数据集(GTM),其总体精度达到了92.8%。
数据集显示:
-
全球梯田面积为85,316千公顷,占全球耕地总面积的5.1%;
-
亚洲梯田面积最大,占全球梯田面积的51%;
-
非洲梯田面积占全球梯田面积的比例为42.5%。
中国、埃塞俄比亚、肯尼亚等国家是梯田面积最大的国家,而卢旺达、布隆迪、埃塞俄比亚等非洲国家梯田面积占比最高,表明东非国家对这种农业实践的依赖程度较高。
图3.全球梯田地图及各地理分布梯田的详细图像。
上述成果以“A 10-meter global terrace mapping using sentinel-2 imagery and topographic features with deep learning methods and cloud computing platform support”为题,发表在期刊《International Journal of Applied Earth Observation and Geoinformation》(IF=7.6,中科院一区TOP)。论文第一作者为空天院与中国地质大学(武汉)联合培养硕士研究生黎一帆,空天院助理研究员田富有与中国科学院青促会会员、副研究员张淼为共同通讯作者,合作作者还包括空天院研究员吴炳方、副研究员曾红伟、Shukri Ahmed博士、助理研究员覃星力,北京师范大学副教授刘焱序以及中国地质大学(武汉)教授王力哲、副教授樊润宇。
该研究工作得到第二次青藏高原综合科学考察研究、国家自然科学基金国际合作重点项目、中国科学院-马普学会合作研究项目、中国科学院青年创新促进会等项目资助。