YOLOv5 实现无人机识别

最新推荐文章于 2025-03-04 10:33:06 发布

3Ｄ视觉工坊

最新推荐文章于 2025-03-04 10:33:06 发布

阅读量5.3k

点赞数 6

文章标签：人工智能深度学习计算机视觉机器学习编程语言

点击上方“3D视觉工坊”，选择“星标”

干货第一时间送达

引言

YOLOv5发布至今，已经迭代多个版本，是唯一基于pytorch框架的YOLO系列的模型框。简单易用，特别适合自定义目标检测与对象检测。只要用了Pytorch版本YOLOv5框架，可以毫不夸张的说两个小时就可以学会目标检测。

第一步数据准备

想用视觉识别一下空中飞行的无人机，识别对象有：

1：鸟类bird2：无人机UAV3：直升机helicopter

想通过自己创建一个数据集，训练yolov5，在调用detect.py来识别一下效果。

百度了一下，发现无法获取别人已经标注好的数据集。（这里提醒大家，自己做数据集不费时间，给100多张图打标签label就行，用不了半个小时）图片就从百度搜索就行，我们的目的是感性的认识这套牛掰的算法，100张图训练个几个小时就可以出来很好的效果，还有不用非要显卡，虽然我的电脑有显卡，但是装pytorch的显卡cuda版本的总是出错，索性不弄了，直接用cpu版本，cpu版本的pytorch包还小，一会儿就能安装好，这100张图我训练了100个epoch花费了3到4个小时，我的电脑的cpu是i7-9700的）

我是从百度上找了大概130多张图片，我截个图：

用labelimage打上标签，所有的标签数量大概也就200来个吧！不会用labelimgage制作数据集的同学可以看这里：

https://github.com/tzutalin/labelImg

yolo的数据文件夹格式又要巩固一下了，先建一个数据文件夹data，在数据文件夹data目录下面建图像文件夹images和标签文件夹labels，然后在images文件夹下面建立训练数据集train和验证集val（validation的缩写，验证校验的意思），在labels的文件夹下面也是建立train和val两个文件夹，分别放训练集和验证集的标签。

另外说一下验证集，验证集里面我找了26张图片，标记了40个左右的labels吧，所以所有的数据加起来大概150张图片。

我放一个图片看一下验证集里面的图片如下图：

到这里为止，所有的数据基本整理完毕，另外还需要几张测试的图片，到测试的时候再从网上找就是了。

配置与修改参数

这里下载yolov5的源码就不写怎么下载了，自己百度就好，相对难度低，我是从gitee上下载的，github总是卡，这个源码也没有多大，几分钟的时间就下载好了。下面直接写怎么改一下代码训练自己制作好的无人机的数据集。

分步骤写吧

首先：明确思路

怎么训练这个算法？我要训练什么模型？我要拿这个模型做什么？这些问题是在训练这个算法的时候首先要想的问题。

回答：

我要训练一个模型能够识别空中飞行的无人机，并打上红框label，空中的复杂环境下可能不只有无人机，会有鸟、树、白云、直升机、飞机等等其他干扰因素印象，简单起见，我又加上了鸟bird和直升机helicopter，所以用yolov5分类nc（number class）为3个，也就是无人机UAV、鸟bird、直升机、helicopter，看下图，建立一个数据信息文件，文件格式yaml

我把这个文件名保存成了chenchen.yaml

训练集图片train在uav_train下面的data里面，训练集也是，这个文件不用写标签label的地址，因为文件夹结构是定的，程序会自动判断出label的位置。

chenchen.yaml文件里面的nc改成2，names改成自己的，也就是uav bird 和helicopter

下面我贴两张图片，这两张图片是我训练了100张图后，测试的标签和测试的预测，基本上框的位置已经很好了，只有左上角的这个直升机helicopter没有被识别出来，这个我感觉是因为我找的直升机图片的问题，这个直升机图片有点特别，训练数据中这样的图片少的原因。

总结：思路明确了，就是做一个三分类模型，无人机、鸟、直升机，

其次修改train.py文件

思路确定了后就是训练这个模型了，我们已经把数据集准备好了，现在就训练这个模型。下载下来的yolo源码里面的train.py文件，我截图一下：

这个是train.py文件

第一：导入各种依赖包；第二：定义train函数方法，主要的就是这个train方法；第三：主程序；

解释一下，各种依赖包不用解释，train方法就是作者的核心了，简单解释就是yolo算法的原理，主程序里面就是调用tran方法画框框，（到目前位置我能给的解释也只有这么多，我没有花费时间研究，我感性上的理解应该是这样）

这个文件中主要要修改的参数是什么呢？

下面这张图中我给出了箭头

第一个箭头：

yolov5s.pt，这个是权重文件，用的是s版本，small，yolov5的权重文件不同分为几个不同版本，这里我用的是s版本，这里可以认为是模型的初始权重，

第二个箭头：

这个yolov5s.yaml文件我保存到了uav_train文件夹里面，这个文件是配置yolov5模型的，叫做配置文件吧，等下这个文件我截图一下，这个文件也要改一个地方。

第三个箭头：

就是数据文件，就是上面定义的一个chenchen.yaml文件，这里有训练数据集的地址。

第四个箭头：

是epoch，我写的是100，大家也可以改成10试一下，20分钟训练完成，我当时做了一下，10个epoch效果很差，100个的时候效果就是我视频的效果，都能到70%准确率以上。

第五个箭头：

是batch，我是16张图片一个batch

第二个箭头解释图片如下：

这里是这个算法的配置文件，最终输出的类别是3，这改成3保存就行，其他的能看出来这个里面是yolo的架构，我也不会解释，有想了解的可以自己百度。

总结：到这里train.py就修改完毕了

训练与测试

到这里就可以训练了，我用的是pycharm这个集成环境，所以选中train.py文件直接右键运行就可以

下面就是漫长的训练时间，只有等着

其实这一步可以不用，test.py文件主要是用来测试验证集val的，这里和训练一样，不要把训练好的权重文件的地址换一下，就是best.pt文件，data的参数改一下，改成chenchen.yaml就可以。最激动人心的是第五步，就是训练好的模型验证一下其他的图片，看看效果怎么样。

测试新图片，新视频看效果

这个文件是detect.py，我截图看下：

这里有四个箭头

第一个：训练好的最好的权重文件，加载上第二个：我从百度找了一个视频文件保存成了666.mp4第三个：置信度，我这里其实可以写0.7，第四个：iou，

解释：如果训练的epoch少，可以把三四箭头改小点，要不然视频和图片中不会被标记出，会让你误认为自己训练的不对。测试效果如下：

本文仅做学术分享，如有侵权，请联系删文。

下载1

在「3D视觉工坊」公众号后台回复：3D视觉，即可下载 3D视觉相关资料干货，涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复：3D视觉github资源汇总，即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复：相机标定，即可下载独家相机标定学习课件与视频网址；后台回复：立体匹配，即可下载独家立体匹配学习课件与视频网址。

重磅！3DCVer-学术论文写作投稿交流群已成立
扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群，目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注：研究方向+学校/公司+昵称，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的视频课程（三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程）、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近2000星球成员为创造更好的AI世界共同进步，知识星球入口：

YOLOv5 实现无人机识别

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款 圈里有高质量教程资料、可答疑解惑、助你高效解决问题觉得有用，麻烦给个赞和在看~

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题
觉得有用，麻烦给个赞和在看~