AgriPest:A Large-Scale Domain-Specific Benchmark Dataset for Practical Agricultural Pest Detection

论文下载地址:AgriPest论文
论文code和dataset:code和dataset
目前在GitHub上面已经找不到了。如果需要code和dataset的直接与论文作者联系可能比较好。
AgriPest是小目标农作物病虫害对象检测数据集(这就要求对象在样本图像中所占的区域面积比较小),它的验证集分为了四种常见场景下的对象检测,这两个方面结合起来更加符合野外虫害识别的实际情况。在此数据集出现之前,我们所做的农作物的病虫害识别一般都是属于较大对象的检测,很多情况下都是在比较单一的背景下,单一对象的情况下对目标进行识别。这个数据集的出现为我们研究野外小目标虫害检测奠定了基础。

摘要

研究人员和社区提供了一个标准的大规模数据集,其中包含实际野生害虫的图像和注释,以及评估程序。在过去的七年中,AgriPest通过我们设计的图像采集设备在田间环境中采集了四种作物的49.7千张图像,其中包含14种害虫。所有的图像都是由农业专家用高达264.7K的害虫定位包围盒手工标注的。本文还提供了对农业害虫的详细分析,其中验证集分为四种类型的场景,在实际的害虫监控应用中很常见。我们探索和评估先进的深度学习技术在农业害虫上的表现。我们相信,农业害虫的规模、准确性和多样性可以为计算机视觉和害虫监测应用领域的研究人员提供巨大的机会。

1. 数据集作物病虫害分类介绍

此数据集主要包含4种作物(稻谷、小麦、玉米、油菜)的14种病虫害(WM:麦螨,SA:麦长管蚜,SG:禾谷缢管蚜,RP:禾谷缢管蚜,SW:粘虫,RPH:稻飞虱,CM:稻纵卷叶螟(症状),rm:禾谷缢管蚜,DP:点状缢管蚜,GM:禾谷缢管蚜,CP:十字花科缢管蚜,MA:灰飞虱,PS:毛竹,CA:尖喙竹),每个害虫类别的样本可视化如下:
在这里插入图片描述
数据集总的病虫害样本有49,707个,其中44,716个样本作为训练样本,4991个样本作为测试样本。具体每一种病虫害样本的数量和分布如下表所示:
在这里插入图片描述
病虫害检测的常见场景分为四种:密集分布、稀疏分布、光照变化和背景杂波。这四种场景的示例样本图像如下图所示:
在这里插入图片描述
害虫测试样本分为四个典型场景,其中单个图像可能包含多种类型的场景,各种虫害样本所属场景的统计如下表所示:
在这里插入图片描述

2. AgriPest数据集与其他农作物病虫害数据集的比较

在这里插入图片描述
与PASCAL VOC数据集相比,PASCAL VOC数据集是最大和典型的通用对象检测数据集之一,AgriPest包含超过四倍的样本图像和八倍多的注释对象。此外,PASCAL VOC和MS COCO都在其图像中组织了许多常见的对象类别,因此目标对象的平均大小显示为很大(整个图像上分别有16.76%和7.74%的区域)。然而,对于田间微小的害虫对象,农业害虫往往更集中于它们真实的身体大小,其中害虫在农业害虫的整个图像上平均只占0.16%的面积,比普通对象检测数据集小几十倍,如图4所示。与传统的只支持单一深度分类层次和测试集中单一场景的通用对象检测任务相比,有害生物监控需要一种高级复杂的验证方法。因此,农业害虫可以为害虫样本和多场景验证提供层次分类,如表3所示。
在这里插入图片描述
与其他现有的害虫数据集相比,AgriPest害虫数据集在害虫分类任务方面也比其他数据集有很大优势[20–22图5a],而在农业害虫图像中,害虫显示为较小。就背景而言,一些当前的害虫检测数据集包含从非现场环境捕获的图像[23图5b]。在这些限制下,大多数现有的害虫数据集难以应用于实际的害虫监测应用。农业害虫针对微小害虫的检测任务,以满足实际应用的要求。此外,与目前的害虫数据集相比,AgriPest农业害虫数据集仍然覆盖了在野外收集的大量图像(图5c)。
在这里插入图片描述
目前用于农业病虫害识别和检测的公共数据集有几个局限性:
1、它们中的大多数通常覆盖少量样本,导致泛化能力较差,使得该模型不能够很好地识别具有各种状态的害虫;
2、许多以解决害虫识别问题为目标的数据集,其中害虫对象在图像中占有很大比例。然而,在现实生活中,害虫总是表现出比较小的尺寸。此外,这些数据集中的大多数图像只包含一个害虫类别,这在实际的害虫图像中可能是不寻常的;
3、一些数据集在实验室或者是非现场环境中使用陷阱设备或者是互联网收集的图像,这些害虫图像具有非常简单的背景,使得难以应对实际领域的复杂性。
本文的贡献主要在以下三个点:
1、用于微小害虫检测研究的病虫害数据集已经发布,该数据集将显著提高智能农业中新目标检测方法应用的有效性和实用性,例如:作物产量预测等;
2、农业害虫定义、分类和建立一系列详细和全面的特定领域子数据集。它的第一类包含两个典型的挑战:害虫检测和害虫种群计数。随后,它将农业虫害密集分布、稀疏分布、光照变化和背景杂波的验证子集分为四种类型,这些在实际害虫监控应用中是常见的;
3、构建了基于在特定任务设备中部署的深度学习检测器的实用害虫监控系统,在该系统中,对农业害虫中最先进的深度学习技术进行了全面的性能评估。

3. 实验结果与分析

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4. 不足与未来的工作

虽然在农业害虫中实现了一些性能良好的最先进的对象检测方法,但未来的研究仍然有两个局限性:
1、数据结构不平衡的问题未能得到解决,有些类别的数据太少了,模型对这些数据的学习程度不够;
2、其次,对于野生小害虫检测任务现有的通用的对象检测方法不是一个合格的解决方案,未来的工
作将集中在覆盖更大数量的类别。

  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 36
    评论
"大规模基准数据集用于评估泛锐化性能"是一个用于评估图像泛锐化算法表现的数据集。泛锐化是一种图像处理技术,旨在通过将低分辨率的多光谱图像与高分辨率的全色图像融合,以产生具有较高空间分辨率和丰富光谱信息的图像。这种技术在许多遥感应用中都很有用,例如土地利用监测、资源管理和环境监测。 该数据集的规模大,包含了大量的多光谱和全色图像对,这些图像对均具有全面的注释和质量测量指标。这些图像对来自各种不同的遥感源,涵盖不同的场景和条件。数据集的构建过程经过精心设计,以保证评估结果的准确性和可靠性。 使用该数据集,研究人员和开发者可以对他们的泛锐化算法进行全面的评估和对比。他们可以将自己的算法应用于数据集中的图像对,并使用数据集中提供的注释进行性能评估。这些注释可以包括图像质量评价指标,如结构相似性指数(SSIM)和峰值信噪比(PSNR),或者一些更复杂的图像质量评价方法,如目标检测和目标分类任务的准确率。通过与其他算法进行比较,开发者可以了解他们的算法在不同场景和条件下的表现如何,并进一步改进和优化他们的方法。 "大规模基准数据集用于评估泛锐化性能"的建立为泛锐化算法的发展提供了一个公共的平台,促进了该领域的研究和进步。研究人员和开发者可以根据数据集中的结果和经验得出更好的算法和技术,进一步提高泛锐化算法在实际应用中的效果。这个数据集的存在为遥感图像处理的研究和应用带来了很大的推动力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 36
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值