项目要求
现有不同种类的鸟,每一类有5张图,要求是对每一幅图中的鸟进行准确定位,即用bounding box将图中的鸟框出来。演示如下:
实现步骤:
1、数据集的制作
使用Make Sense网站制作数据集,创建六类鸟的labels,并对图像进行标注,并将其导出为yolov所使用的文件形式
2、下载yolov5官方代码,并下载yolov5s.pt,将其作为预训练使用的权重。
3、在目录下新建一个mydata文件夹,在该文件夹下面新建如下图的文件夹
其中image的train和val文件夹中存放训练和预测的图片,labels下面存放制作好的数据集和用来预测的数据集(val下面的文件是后面运行过程中生成的),test文件夹下存放用来测试的图片。
4、在文件中放入yolov5s.pt预训练权重。
5、将文件打包上传到colab上(本计算机算力不够,故采用colab进行训练)
6、修改colab配置,选择使用GPU进行训练
7、使用指令解压文件
!unzip -uq birds.zip
8、使用指令切换工作目录,并安装yolov5所需要的依赖库
%cd /content/birds/yolov5-master/
!pip install -r requirements.txt
9、将data目录下的VOC.yaml复制一份,并将其命名为birds.yaml,并修改以下代码为自己的文件路径
train: /content/birds/yolov5-master/mydata/images/train # train images (relative to 'path') 30 images
val