基于轻量级YOLOv5开发构建鸟类检测识别分析系统

文章介绍了在环保、湿地公园等场景中,鸟类可能带来的安全隐患,为此开发了一个轻量级的鸟类检测系统。该系统利用YOLOv5的n系列模型进行单类别检测,数据集清晰,标注文件包括YOLO和VOC格式。经过训练和评估,检测效果良好,具有高置信度,并提供了混淆矩阵、F1曲线、PR曲线等分析图表。
摘要由CSDN通过智能技术生成

在一些特殊场景诸如:环保、湿地公园、电力设施等,鸟类是一个很大的安全隐患,有效地监测到鸟类并及时预警驱逐对于安全正常地生产进行有着重要的作用。这里主要是基于前文的基础上开发构建的轻量级的鸟类检测系统,首先看下效果:

接下来看下数据集:

YOLO格式标注文件如下:

实例标注内容如下所示:

0 0.51875 0.501389 0.579167 0.863889

VOC格式标注文件如下所示:

实例标注内容如下所示:

<annotation>
    <folder>DDDD</folder>
    <filename>00c25dd7-03f3-4cc8-bc82-c5d21088df21.jpg</filename>
    <source>
        <database>The DDDD Database</database>
        <annotation>DDDD</annotation>
        <image>DDDD</image>
    </source>
    <owner>
        <name>YSHC</name>
    </owner>    
    <size>
        <width>361</width>
        <height>500</height>
        <depth>3</depth>
    </size>
    <segmented>0</segmented>
    
    <object>        
        <name>Carolina_Wren</name>
        <pose>Unspecified</pose>
        <truncated>0</truncated>
        <difficult>0</difficult>
        <bndbox>
            <xmin>114</xmin>
            <ymin>102</ymin>
            <xmax>250</xmax>
            <ymax>222</ymax>
        </bndbox>
    </object>
    
</annotation>

这里因为是单类别的检测,且整体数据集观察发现,数据是比较清晰直观的,所以直接采用了YOLOv5最轻量的n系列的模型,如下:

#Parameters
nc: 1  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 0.25  # layer channel multiple
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

#Backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [64, 6, 2, 2]],  # 0-P1/2
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],  # 9
  ]

#Head
head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],  # cat backbone P4
   [-1, 3, C3, [512, False]],  # 13

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],  # cat backbone P3
   [-1, 3, C3, [256, False]],  # 17 (P3/8-small)

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],  # cat head P4
   [-1, 3, C3, [512, False]],  # 20 (P4/16-medium)

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],  # cat head P5
   [-1, 3, C3, [1024, False]],  # 23 (P5/32-large)

   [[17, 20, 23], 1, Detect, [nc, anchors]],  # Detect(P3, P4, P5)
  ]

默认执行100次的迭代计算,如下:

混淆矩阵:

F1曲线:

LABEL可视化:

PR曲线:

batch计算实例:

可以看到:检测识别的效果是非常不错的,而且置信度都很高。

可视化推理样例如下:

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Together_CZ

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值