使用改进的YOLO-V4网络实时检测水产养殖水下图像中未吃完的饲料颗粒

人small志气tall

已于 2022-11-25 15:36:47 修改

阅读量895

点赞数 1

分类专栏：论文精读文章标签：网络人工智能剪枝 python

于 2022-11-24 23:52:00 首次发布

本文链接：https://blog.csdn.net/Brunoaa/article/details/128022531

版权

论文精读专栏收录该内容

1 篇文章 0 订阅

订阅专栏

原文链接：

《Real-time detection of uneaten feed pellets in underwater images for aquaculture using an improved YOLO-V4 network》

https://www.sciencedirect.com/science/article/pii/S0168169921001538?ref=pdf_download&fr=RR-2&rr=76f3440b7c8dfa12

研究背景：

水产养殖业生产了世界上三分之二的水产品。是人类重要的高质量蛋白质来源。但鱼类的安全与健康受很多方面因素的影响，其中最重要的一个因素就是不合理喂养——尤其是过度投食。培养系统中超过60%的饲料以微小颗粒的形式存在。这些微小颗粒1、会消耗氧气产生氨气和其他有毒物质，严重影响鱼类的安全健康，甚至造成鱼类死亡。另外，饲料的浪费也会2、增加饲料成本占总成本的比例。因此，实时监测未吃的饲料可以有效减少过度喂养的发生。成本降低了，而水质也可以得到明显的改善。这对指导生产具有重要的科学意义。

现存问题：

小目标、复杂背景、鱼类的干扰，都给水下饲料颗粒的识别带来了巨大挑战。在之前的研究中通常使用声波技术来对食物颗粒进行探测。例如用超声波回声法量化未吃完的饲料颗粒的数量。最原始：Juell (1991)利用“回声积分法”来估算下落饲料颗粒的丰富度。然而自动化的声学应用需要对颗粒及其状态进行声学表征。到了晚上，声呐系统的作用会受限于单色（黑白）以及低质量的图像。而声波技术的实现通常昂贵且易受噪音干扰，限制了它在实际生产中的应用。

机器视觉方法出现：1、受限于软硬件条件——在水箱中放置水下摄像机进行拍摄。2、随着图像处理技术的发展——提出了适应性强的阈值分割方法。以上方法依然面临挑战：图片模糊不清、小目标问题、颗粒密度高、运动模糊；需要手动选择检测目标的特征。所以，在真实场景中监测未吃饲料颗粒的精确度仍然需要提高。

作者提出的改进：

改进特征图提取网络——
为解决小目标数量过多的问题，对PANet路径聚合网络连接进行了修改，以获得具有更细粒度信息的特征图，并对修剪负责检测大目标的特征图。
改变PANet网络结构，以改善YOLO-V4的特征图。
融合更多的浅层特征图信息，以保留更多的浅层特征。
生成有利于小目标探测的特征图，获得更丰富的细粒度信息。
放弃负责大目标检测的特征图。

主干层的卷积层输出被额外上采样，其输出与CSPDarknet53中相应的C2层融合，生成F2特征图。在保证检测任务的前提下，减少了网络末端的两次下采样操作，删除了F4和F5特征图，使模型计算成本最小化。

为提高训练速度，将剩余网络改为密集连接型网络。使得网络的特征转移和重用得到增强，也解决了数据集训练过程中梯度消失的问题。

YOLO-V4中CSPDarknet53的剩余模块连接模式被修改为密集型。Res单元中，引入了DenseNet的密集连接机制，并增加了两个快捷连接。将新的连接块命名为Dense单元，其解决了小目标检测中梯度消失的问题，强化了特征转移和重复使用。

梯度消失和梯度爆炸产生的原因：在反向传播过程中需要对激活函数进行求导，如果导数大于1，那么随着网络层数的增加梯度更新将会朝着指数爆炸的方式增加这就是梯度爆炸；如果导数小于1，随着网络层数的增加梯度更新信息会朝着指数衰减的方式减少——这就是梯度消失。梯度消失、爆炸，其根本原因在于反向传播训练法则，属于先天不足。

为提高计算速度，减少YOLO-V4的网络层数，将CSPDarknet53中的卷积块改为密集连接块，以减少冗余特征的出现。

去冗余化的改进：YOLO-V4网络层数多，适合于训练复杂困难的数据集。而水下未吃的饲料颗粒数据集只有一个检测类，重点在于小目标检测和特征重用问题。因此，YOLO-V4对于本任务过于冗余。针对这一问题对修改算法，对主干网进行去冗余操作，减少网络层的数量，将CSPDarknet53中的convolution blocks修改为dense connection blocks，从而减少冗余特征的数量，提高计算速度。

结论：

为了克服低质量水下图像和极小目标在饲料颗粒检测中的挑战，本文提出了一个改进的YOLO-V4网络来检测水下图像中未吃的饲料颗粒。YOLO-V4网络是通过使用密集连接和去冗余操作对特征图进行修改而改进的。本次实验结果表明，所提出的改进的YOLO-V4网络优于原YOLO-V4网络。AP50从65.40%增加到92.61%，总共增加了27.21%。改进后的网络还减少了约30%的计算量。这表明，使用改进的特征图提取网络和密集连接能有效提高检测精度，而使用去冗余方法能有效提高检测速度。

人small志气tall

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
4
评论
使用改进的YOLO-V4网络实时检测水产养殖水下图像中未吃完的饲料颗粒

科技论文Real-time detection of uneaten feed pellets in underwater images for aquaculture using an improved YOLO-V4 network精读与思考，结合论文做了一些知识扩展。
复制链接

扫一扫