论文作者:Zixuan He,Salik Ram Khana,Xin Zhang,Manoj Karkee,Qin Zhang
作者单位:Washington State University; Mississippi State University
论文链接:http://arxiv.org/abs/2308.03998v1
内容简介:
1)方向:目标检测模型
2)应用:农业领域,草莓检测
3)背景:本研究提出了一种名为YOLOv5s-Straw的目标检测架构,用于在户外环境中检测草莓。研究对YOLOv5s的原始架构进行了修改,通过将C3模块替换为C2f模块,提供了更好的特征梯度流。其次,在YOLOv5s的骨干网络的最后一层中,将Spatial Pyramid Pooling Fast与Cross Stage Partial Net相结合,以提高在本研究中草莓数据集的泛化能力。
4)方法:研究使用了包含三个成熟度类别(未成熟、几乎成熟和成熟)的草莓冠层的RGB图像数据集,并通过一系列操作(包括亮度降低、亮度增加和添加噪声)进行了增强。为验证所提出的方法在户外环境中对草莓的检测优越性,研究训练了四个竞争性的检测模型(YOLOv3-tiny、YOLOv5s、YOLOv5s-C2f和YOLOv8s),并在相同的计算环境下进行了测试并与YOLOv5s-Straw进行了比较。
5)结果:结果显示,使用所提出的架构获得了80.3%的最高平均精度,而YOLOv3-tiny、YOLOv5s、YOLOv5s-C2f和YOLOv8s分别获得了73.4%、77.8%、79.8%和79.3%的平均精度。具体而言,YOLOv5s-Straw在未成熟类别的平均精度为82.1%,几乎成熟类别为73.5%,成熟类别为86.6%,分别比最新的YOLOv8s高出2.3%和3.7%。该模型包含了860万个网络参数,推断速度为每张图像18毫秒,而YOLOv8s的推断速度较慢,为21.0毫秒,网络参数重达1110万个。这表明所提出的模型足够快,可以实时进行机器人采摘时的草莓检测和定位。