YOLOv4安装和训练

ʚVVcatɞ

已于 2022-03-09 01:16:29 修改

阅读量7.9k

点赞数 6

分类专栏：深度学习文章标签： yolov4

于 2022-02-25 13:58:07 首次发布

本文链接：https://blog.csdn.net/qq_44989881/article/details/122822111

版权

深度学习专栏收录该内容

29 篇文章 7 订阅

订阅专栏

环境

Windows：10
YOLOv4
OpenCV：4.5.3
Visual Studio 2019：16.11
CUDA：11.2.0_460.89_win10
cudnn：11.2-windows-x64-v8.1.1.33

硬件

NVIDIA GeForce RTX 3070 Ti

OpenCV 4.5.3网址：https://sourceforge.net/projects/opencvlibrary/files/4.5.3/
OpenCV 4.5.3下载链接：https://nchc.dl.sourceforge.net/project/opencvlibrary/4.5.3/opencv-4.5.3-vc14_vc15.exe

安装完成后为OpemCV添加环境变量。
在这里插入图片描述

Visual Studio 2019网址：https://docs.microsoft.com/en-us/visualstudio/releases/2019/release-notes-preview

在这里插入图片描述

CUDA网址：
https://developer.nvidia.com/cuda-11.2.0-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exelocal
CUDA下载链接：
https://developer.download.nvidia.cn/compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.89_win10.exe
在这里插入图片描述
cudnn网址：https://developer.nvidia.com/rdp/cudnn-archive

cudnn下载链接：https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.1.1.33/11.2_20210301/cudnn-11.2-windows-x64-v8.1.1.33.zip

验证CUDA是否安装成功

nvcc --version

C:\Users\78694>nvcc --version
nvcc: NVIDIA ® Cuda compiler driver
Copyright © 2005-2020 NVIDIA Corporation
Built on Mon_Nov_30_19:15:10_Pacific_Standard_Time_2020
Cuda compilation tools, release 11.2, V11.2.67
Build cuda_11.2.r11.2/compiler.29373293_0

在这里插入图片描述
将cudnn解压出来，然后将cudnn中的 bin、include、lib文件夹移动到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2 文件夹下。

注：C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2是我的电脑安装CUDA的路径为例。可以根据自己安装的 CUDA路径，找到 …\NVIDIA GPU Computing Toolkit\CUDA\v11.2，移动到 v11.2目录下。
在这里插入图片描述

YOLOv4：https://github.com/AlexeyAB/darknet
在这里插入图片描述

在darknet.vcxproj文件下，官方给出的配置为

<Import Project="$(VCTargetsPath)\BuildCustomizations\CUDA 11.1.props" />

<Import Project="$(VCTargetsPath)\BuildCustomizations\CUDA 11.1.targets" />

根据自己电脑安装的CUDA的版本，修改为对应的版本，我的电脑安装的是CUDA 11.2版本，所以修改如下图。
在这里插入图片描述

使用Visual Studio 2019打开YOLOv4项目，打开成功后，会弹出重定向项目，选择
Windows SDK版本：最新安装的版本
平台工具集：升级到v142
然后点击确定。

在这里插入图片描述

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\extras\visual_studio_integration\MSBuildExtensions 或 C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\BuildCustomizations
找到以下几个文件

CUDA 11.2.props
CUDA 11.2.targets
CUDA 11.2.xml
Nvda.Build.CudaTasks.v11.2.dll

然后把以上4个文件复制粘贴到 C:\Program Files (x86)\MSBuild\Microsoft.Cpp\v4.0\v140目录下和 D:\work\MicrosoftVisualStudio\Community\MSBuild\Microsoft\VC\v160\BuildCustomizations目录下

对项目进行重新生成
在这里插入图片描述
以下是项目生成成功后的结果。

在yolov4的官方下载yolov4.weights权重文件对重新生成的项目进行测试。

在这里插入图片描述
启动 Windows PowerShell

在这里插入图片描述

./darknet.exe detector test cfg/coco.data cfg/yolov4.cfg yolov4.weights -ext_output dog.jpg

以下为使用官方训练好的权重文件，对图片进行的预测效果。
在这里插入图片描述

在这里插入图片描述

voc.names文件用来存放标签的名字
例如

aeroplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor

voc.data文件

分类：classes= 20
训练路径：train = data/train_voc.txt
valid = data/2007_test.txt
#difficult = data/difficult_2007_test.txt
names = data/voc.names
backup = backup/

train 文件内容
在这里插入图片描述

valid 文件内容
在这里插入图片描述

训练完成后，权重文件保存的路径：backup

yolov4.cfg文件
在这里插入图片描述

在这里插入图片描述

参数

batch：批尺寸，每一次迭代送到网络的图片数量。在固定最大迭代次数的前提下，增加batch会延长训练时间，但会更好的寻找到梯度下降的方向。如果显存够大，可以适当增大这个值来提高内存利用率。batch过小的话会让训练不够收敛，过大会陷入局部最优。
subdivisions：将每一次batch的数量，分成subdivisions对应的数字的份数。如果内存不够大，会将batch分割为subdivisions个子batch，每个子batch大小为batch/subdivisions。
max_batches：图片训练的最大迭代次数（class*2000），例如2个标注信息，就是2 * 2000 = 4000。
图片分类：classes=80，代表有80个分类。
filters=255：3*（5+class）例如 class = 2 则 filters=21。
steps=3200,3600：第一个参数 max_batches * 0.8, 第二参数 max_batches * 0.9。

注意：一共有三处yolo需要修改，三处同样的 filters 和 classes 都要修改。快速找到三处，快捷键ctrl + f 输入yolo会自动定位到需要修改的位置。

下载预训练权重文件 yolov4.conv.137
在这里插入图片描述

在这里插入图片描述

使用预训练权重文件开始训练：

./darknet.exe detector train data/voc.data cfg/yolov4.cfg yolov4.conv.137

不使用预训练权重文件，从零开始训练

./darknet.exe detector train data/voc.data cfg/yolov4.cfg -map

在这里插入图片描述

测试

./darknet.exe detector test data/voc.data cfg/yolov4.cfg backup/yolov4_last.weights -i 0 -thresh 0.25 data/datasets/baidu000000.jpg

thresh：为置信度，范围 0 ~ 1.00之间

在这里插入图片描述

遇到以下问题
（1）在训练的过程中
Can’t open label file. (This can be normal only if you use MSCOCO)
在这里插入图片描述

解决办法：图片和txt文件要放在同一目录下。
在这里插入图片描述

并检查train文件和valid文件内容中的图片路径和标签路径是否正确，如果路径不对也会无法打开图片或标签文件。

在这里插入图片描述

参考网址：https://ccoderun.ca/programming/darknet_faq

ʚVVcatɞ

关注

6
点赞
踩
35

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录