YOLO新模型:助力智慧农业,一种改进的基于注意力机制和特征融合的茶叶病害检测模型...

点击蓝字 关注我们

关注并星标

从此不迷路

计算机视觉研究院

4471a07b41c55b32d06c6cb72b5bff9d.gif

58eacde3f75919a7d57a64cd560c165e.gif

公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式

计算机视觉研究院专栏

Column of Computer Vision Institute

基于AI技术帮助中国农业快速发展,智慧农业也是最近几年的热门话题。

62aa263a0ca56bc47302725f87085b9d.gif

01

前景概要

在茶树生长过程中,茶树病害对茶叶产量和品质有着重要影响。茶叶病害的形态和规模各不相同,病害靶标通常较小,茶叶病害的智能检测过程也容易受到生长区域复杂背景的干扰。此外,一些茶叶病害集中在整个茶叶区域,需要从全局信息中推断。常见的目标检测模型很难解决这些问题。

因此,我们提出了一种改进的茶叶病害检测模型。我们使用在中国茅山茶厂收集的茶叶病害数据集。利用自注意机制增强了模型获取全局茶叶病害信息的能力。利用BiFPN特征融合网络和自适应空间特征融合(ASFF)技术改进了茶病的多尺度特征融合,增强了模型抵抗复杂背景干扰的能力。我们集成了Shuffle Attention机制来解决小目标茶病难以识别的问题。此外,我们使用数据增强方法和迁移学习来扩展数据集,并重新定位从其他植物病害数据集学习到的参数,以增强茶叶病害的检测。最后,使用SIoU进一步提高了回归的准确性。实验结果表明,该模型很好地解决了茶叶病害智能识别中遇到的一系列问题。检测精度领先于主流目标检测模型,检测速度达到实时水平。

2f0bdd762b6c0b162bcab3c77f722409.gif

02

项目背景

中国是世界上茶树种植面积最大的国家,也是世界上最大的茶叶生产国。据国际茶叶委员会统计,2020年全球茶叶产量626.9万吨,其中中国茶叶产量高达298.6万吨,占全球茶叶总产量的47.6%。在茶叶种植和生长过程中,茶叶病害(包括病虫害)是影响产量和品质的重要因素,严重的茶叶病害会造成巨大的经济损失。例如,安溪县是中国最大的乌龙茶产区,茶园总面积60万亩,每年因茶病造成的经济损失高达6000万元。常见的茶病害主要有茶叶枯萎病、紫背病和茶藻斑病。上述茶病也是对茶树危害最大的常见病,每年可反复感染茶树一次以上。它们大多发生在温暖潮湿的季节。茶树感染病害后,往往伴随着茶叶早落和芽枯萎,导致整个茶树衰退,甚至茶园整体病害,呈现衰退现象,给广大茶农带来巨大损失。当茶树感染了这种疾病时,有必要在疾病的早期清除患病的枝条或喷洒杀虫剂。鉴定茶叶病害的传统智慧在很大程度上依赖于人类的专业知识和检查(如现场观察和诊断)。然而,茶叶病害种类繁多,发生区域广,人工检测方法主观性强,一致性差,错误率高。

随着机器学习的快速发展,图像处理和机器学习在作物病害识别中得到了广泛的应用。有些研究将自适应神经模糊推理系统和颜色小波特征用于茶叶病害识别。利用人工神经网络提高了茶叶病害的识别精度。对随机森林分类器进行了改进。通过结合属性评估方法和实例滤波器对花生病害进行分类。使用Haar和AdaBoost分类器设计了一个水稻叶病图像处理系统进行识别,识别准确率为83.33%。此外,他们还使用K近邻和支持向量机(SVM)对水稻叶病进行分类,准确率分别为91%和93%。有研究者使用SVM分类器检测葡萄叶片病害。在k-means聚类之后,他们使用SVM进行特征提取和分类,并获得85%的准确率。有将SVM与线性迭代聚类相结合,从复杂背景中提取茶叶病害图谱,有助于进一步识别茶叶病害。对葡萄叶片病害进行了分割和鉴定。在特征提取过程中,采用了局部对比度雾度降低和增强技术来提高图像质量。在特征融合过程中,采用邻域分量分析方法去除冗余特征。基于实验,葡萄叶病的分割和分类准确率分别为90%和92%。然而,传统的机器学习方法需要大量的图像来进行疾病特征提取,并且特征提取依赖于手动设计而不是自动学习。

我们的研究致力于解决一般目标检测模型难以有效识别茶病目标的问题。为了解决茶叶病害智能识别过程中遇到的一系列问题,设计了一种改进的茶病害智能识别模型。所提出的模型改进了不同尺度茶叶病害特征的融合,更加关注茶叶病害区域,对小目标茶叶病害具有更好的检测效果,能够更好地利用全局信息推断茶叶病害。在检测过程中,抵抗复杂背景干扰的效果也更高。我们利用一系列技术提高了茶叶病害智能检测的准确性,检测速度达到了实时水平。该模型的大规模部署可以及时准确地检测茶树病害,取代传统低效的人工检测,从而采取有针对性的措施来控制和提高茶叶的生产效率和质量。

cf4212453e876f50e91316bb1856996a.gif

03

框架简单介绍

  • 数据增强

混合使用数据增强方法不仅可以扩展数据集,还可以避免过拟合,提高模型的鲁棒性,包括在线和离线增强方法。

9bc70cbbd031b2d2f2133868718c878f.jpeg

左边是输入图像,右边是随机抹除

训练样本的数量与在线增强期间训练集中的图像数量相同。除了基本的图像增强操作外,在训练过程中还使用了马赛克数据增强方法来处理数据样本;即,将多个图片随机剪切并拼接成一个图片用作训练样本。在随机拼接的过程中,同一张图片可能有不同种类的茶病。更丰富的图片背景可以带来更高的模型训练效率。马赛克数据增强的一个示例如下图所示。

ab0e5abebf97e08f4ad494d6acb1d0b1.jpeg

  • 新检测框架

下图就展示了我们改进模型的网络结构。根据上述方法,我们对原始YOLOv5算法进行了一系列改进。首先,将Transformer模块插入YOLOv5的主干中。Transformer的自注意机制能够增强模型的全局感受野,获得更多的上下文信息,并为原始卷积层带来互补优势,更有利于捕捉茶叶病害的全局特征。

0031019e21e46d81785164419a51f560.jpeg

  • 改进的损失函数

我们分析了YOLOv5原有损失函数的不足,并采用了优化的损失函数。对于未改进的YOLOv5,使用CIoU损失作为边界框的损失函数,使用Logits损失函数和二元交叉熵分别计算目标分数和类别概率的损失。

ac90229e8ccc68e38a4646b64dff0320.jpeg

CIoU方案如上图所示。CIoU Loss综合考虑了覆盖面积、纵横比和中心距离,可以很好地测量其相对位置,解决了优化预测框的水平和垂直方向的问题,但这种方法没有考虑目标框和预测框之间的方向匹配,导致收敛速度慢。因此,我们采用了SIoU损失。如下图所示,SIoU引入了目标框和预测框之间的矢量角进行优化。

e7b1871362e8cfe55477c4f179dbadb9.jpeg

  • 迁移学习

训练需要大量的样本来保证训练性能。由于数据样本数量有限,直接从头开始训练很难获得良好的检测结果。迁移学习是一种将已知领域的知识应用于目标领域的技术,它可以将训练好的网络模型从大型数据集转移到新的数据集,并实现网络模型参数和权重在新数据集上的重用。

由于缺乏大规模的茶叶病害图像样本,且茶叶病害特征与其他植物病害特征相似,引入了一种迁移学习方法来提高模型的性能。Plant Village是一个非常大的植物叶片病害数据集,由54306张植物叶片图像组成,包括14种植物,根据物种和病害分为38类。我们使用从互联网上收集的植物村数据集和其他植物病害数据集进行预训练。

69851623f985bd7c5f54b0e8d1f69c20.gif

04

实验及实际应用

用不同算法进行了测试,并在实际应用的效果如下。

d5db8ffaf4cc8d9a7b969626ae7b9b7d.png

yolov5的效果

49635a5f105fa5032cb665e75941bdc1.png

新模型的效果

60270b3c03a82049a34b4b1e74db3dd9.png

yolov5的效果

e94438db373d76c2456a21a3ce91b668.png

新模型的效果

实际应用的截图:

18cf16634f31be516d8aee8fc2f77eac.png

60c75bd7c4faca247dc1af2b7fec1e8a.png

© THE END 

e9155e0e7b6303fb2f870f7a3ddf5469.gif

转载请联系本公众号获得授权

1ec0a78623a434bf81c3e56033e7fafe.gif

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

cf20692dabde11b9a1d61129caa9054c.png

 往期推荐 

🔗

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
YOLO(You Only Look Once)是一种常用的目标检测算法,它通过将图像划分为网格单元,并在每个单元中预测边界框和类别来实现目标检测。然而,原始的YOLO算法存在一些注意力不足的问题,导致在复杂场景下容易错过小目标或者出现多个边界框的问题。 为了改进YOLO注意力机制,可以考虑以下几点: 1. 多尺度注意力:通过在不同尺度上应用注意力机制,可以提高对不同大小目标的检测能力。可以使用特征金字塔网络(Feature Pyramid Network,FPN)来获取多尺度的特征,并在每个尺度上应用注意力机制。 2. 上下文信息融合:除了单纯关注目标物体的特征,还可以引入上下文信息来提升注意力机制。可以使用全局上下文注意力机制,将整个图像的信息融入到目标检测中,从而更好地理解目标所在的环境。 3. 动态注意力:基于目标的重要性和复杂性,可以采用动态调整的注意力机制。例如,可以根据目标的大小、位置、形状等因素动态调整不同区域的注意力权重,以提高对关键目标的检测精度。 4. 多任务学习:除了目标检测,可以将其他任务(例如语义分割、实例分割等)与注意力机制相结合,以进一步提升模型的性能。通过共享注意力机制和特征提取器,可以实现多个任务之间的信息交互和互补。 综上所述,通过引入多尺度注意力、上下文信息融合、动态调整和多任务学习等方法,可以改进YOLO算法的注意力机制,提高目标检测的准确性和鲁棒性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机视觉研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值