二、YOLO训练与GPU识别的环境搭建

最新推荐文章于 2023-12-18 16:50:21 发布

胸毛飘荡

最新推荐文章于 2023-12-18 16:50:21 发布

阅读量2.8k

点赞数 1

分类专栏： YOLO实时物体检测文章标签： yolov3 yolov3 训练 yolov3 gpu训练 yolov3 gpu识别 yolo cpu环境

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yumening77/article/details/101431548

版权

YOLO实时物体检测专栏收录该内容

2 篇文章 0 订阅

订阅专栏

首先要安装好YOLO，再进行下面的GPU识别与训练环境的搭建。

如果还未安装YOLO的，请先参考下面链接进行安装：

https://blog.csdn.net/yumening77/article/details/97133794

以下环境搭建基于ubuntu系统，主要分为三个步骤：

显卡驱动的安装
CUDA的安装
CUDNN的安装
修改makefile文件

一、显卡驱动的安装

非阿里云vgn5i 型实例适用

1.查看GPU型号

lspci | grep -i nvidia

如上图所示，可以看到GPU型号是Tesla P100

2.下载对应的显卡驱动

https://www.nvidia.com/Download/index.aspx?lang=cn

然后点击搜索，再点击产品支持列表，可以看到，该显卡驱动支持Tesla P100

下载对应的显卡驱动并传输到ubuntu系统中

3.安装显卡驱动

sudo chmod a+x NVIDIA-Linux-x86_64-384.183.run

sudo ./NVIDIA-Linux-x86_64-384.183.run

选择ok和yes

最后如果出现如下错误：

WARNING: nvidia-installer was forced to guess the X library path '/usr/lib' and X module path '/usr/lib/xorg/modules'; these paths were not queryable from the system. If X fails to find the NVIDIA X driver module, please install the

`pkg-config` utility and the X.Org SDK/development package for your distribution and reinstall the driver

安装依赖：sudo apt install dkms build-essential linux-headers-generic

执行：sudo apt-get install pkg-config

然后再执行：nvidia-smi

看到如下界面说明显卡驱动安装成功

阿里云vgn5i（云虚拟机、最便宜那种）型实例适用

方法一（阿里云文档给出的，但是我试过好像不行，我用的是方法二）：

1.禁用nouveau

a. 查看是否存在blacklist-nouveau.conf文件。

ls /etc/modprobe.d/blacklist-nouveau.conf

如果文件存在，则跳过本步骤。如果文件不存在，则执行命令：

vim /etc/modprobe.d/blacklist-nouveau.conf

b. 创建文件，并在文件中添加以下内容禁用nouveau。

blacklist nouveau blacklist lbm-nouveau options nouveau modeset=0

c. 生成kernel initramfs。

rmmod nouveau update-initramfs -u

d. 重启实例。

reboot

2.下载GRID驱动包（GRID就是GPU驱动）

a. 下载GRID驱动安装包。

- - 如果实例位于华南1 可用区C、可用区D下，请下载GRID 7.0 Guest驱动：

wget http://nvdia-driver-410.oss-cn-shenzhen.aliyuncs.com/NVIDIA-Linux-x86_64-410.39-grid.run

- - 如果实例位于其它地域和可用区，请下载GRID 8.0 Guest驱动：

wget http://nvidia-418.oss-cn-shenzhen.aliyuncs.com/NVIDIA-Linux-x86_64-418.70-grid.run

b. 安装GRID驱动。

chmod +x NVIDIA-Linux-x86_64-410.39-grid.run ./NVIDIA-Linux-x86_64-410.39-grid.run

c. 测试GRID驱动是否安装成功。

nvidia-smi

如果返回以下GRID驱动信息，说明驱动安装成功。

方法二：

1.修改内核

Ubuntu切换内核到4.4.0-131-generic：

vi /etc/default/grub

设置GRUB_DEFAULT='Advanced options for Ubuntu>Ubuntu, with Linux 4.4.0-131-generic'

然后更新一下

update-grub

2.升级系统并安装KDE桌面

升级系统并安装KDE桌面

apt-get update

apt-get upgrade

apt-get install kubuntu-desktop

重启系统

reboot

3.安装GRID驱动

wget http://nvdia-driver-410.oss-cn-shenzhen.aliyuncs.com/NVIDIA-Linux-x86_64-410.39-grid.run

chmod 777 NVIDIA-Linux-x86_64-410.39-grid.run

./NVIDIA-Linux-x86_64-410.39-grid.run

nvidia-smi

如果返回以下类似结果，说明驱动已经成功安装。

二、CUDA的安装

1.下载CUDA

https://developer.nvidia.com/cuda-toolkit-archive

如果没有账号需要先注册登录

在安装显卡驱动时，选择的CUDA Toolkit版本为9.0的，如下图

所以要下载对应版本的CUDA

2.安装cuda

若是cuda10.1则参考：https://www.cnblogs.com/zmbreathing/p/CUDA.html

执行如下命令：

sudo sh cuda_9.0.176_384.81_linux.run

cuda_9.0.176_384.81_linux.run是对应cuda的文件，根据版本不同文件名也会不同。

然后用一本书的书角压住回车键，直到服务条款显示到100%。接着按下面的步骤选择：

accept

n（不要安装driver）

y

y

y

如下图：

3.设置环境变量。

安装完成后，设置环境变量。

打开主目录下的 .bashrc文件添加如下路径，例如我的.bashrc文件在/root下（默认安装路径），如果没有找到，则按Ctrl+H键显示隐藏文件。

以下都是默认安装路径

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64

export PATH=$PATH:/usr/local/cuda-9.0/bin

export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-9.0

终端运行：source ~/.bashrc

检查：nvcc --version，如果显示下面的文子就说明安装成功了。

三、CUDNN的安装

1.下载CUDNN

https://developer.nvidia.com/rdp/cudnn-archive

下载与CUDA版本对应的CUDNN

然后选择Linux的CUDNN库（别选Ubuntu的，deb文件不好安装）

2.解压

由于下载的文件是solitairetheme8 格式，需要修改后缀后再进行解压。

cp cudnn-9.0-linux-x64-v7.6.1.34.solitairetheme8 cudnn-9.0-linux-x64-v7.6.1.34.tgz

tar -xvf cudnn-9.0-linux-x64-v7.6.1.34.tgz

ls

确保可以看到cuda文件加被解压了出来

3.配置

输入如下命令：

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/

sudo chmod a+r /usr/local/cuda/include/cudnn.h

sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

4.查看CUDNN版本

cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

如下出现如下界面，说明安装成功。

四、修改Makefile文件

打开darknet/MakeFile文件，进行如下修改：

GPU=1 #如果使用GPU设置为1，CPU设置为0

CUDNN=1 #如果使用CUDNN设置为1，否则为0

OPENCV=0 #如果调用摄像头，还需要设置OPENCV为1，否则为0

OPENMP=0 #如果使用OPENMP设置为1，否则为0

DEBUG=0 #如果使用DEBUG设置为1，否则为0

CC=gcc

NVCC=/usr/local/cuda-9.0/bin/nvcc #NVCC=nvcc 修改为自己的路径

AR=ar

ARFLAGS=rcs

OPTS=-Ofast

LDFLAGS= -lm -pthread

COMMON= -Iinclude/ -Isrc/

CFLAGS=-Wall -Wno-unused-result -Wno-unknown-pragmas -Wfatal-errors -fPIC

...

ifeq ($(GPU), 1)

COMMON+= -DGPU -I/usr/local/cuda-9.0/include/ #修改为自己的路径

CFLAGS+= -DGPU

LDFLAGS+= -L/usr/local/cuda-9.0/lib64 -lcuda -lcudart -lcublas -lcurand #修改为自己的路径

endif

修改后进行保存，然后在darknet目录下再次编译：

make

编译结束后，再次执行：

./darknet detect cfg/yolov3.cfg yolov3.weights data/dog.jpg

注意：虚拟机或者云虚拟机（阿里云vgn5i）要使用GPU和CUDA的话

假如在检测实例的时候，出现如下报错：

Error: all CUDA-capable devices are busy or unavailable

可能需要按以下步骤。

1.安装GRID，上面已有描述

2.申请一个 License，并搭建对应的服务器（或者在阿里云工单里面向他们要一个测试用的License）

申请参考：https://forum.huawei.com/enterprise/zh/thread-475551.html

3.参考下面链接中的第5到第7步

https://help.aliyun.com/document_detail/118852.html?spm=a2c4g.11186623.6.608.7ff5674dboosfc

error while loading shared libraries: libcudart.so.9.0: cannot open shared object file: No such file

解决方案：

sudo cp /usr/local/cuda-9.0/lib64/libcudart.so.9.0 /usr/local/lib/libcudart.so.9.0 && sudo ldconfig

sudo cp /usr/local/cuda-9.0/lib64/libcublas.so.9.0 /usr/local/lib/libcublas.so.9.0 && sudo ldconfig

sudo cp /usr/local/cuda-9.0/lib64/libcurand.so.9.0 /usr/local/lib/libcurand.so.9.0 && sudo ldconfig

error while loading shared libraries: libcudnn.so.7: cannot open shared object file: No such file or directory.

解决方案：

sudo cp /usr/local/cuda/lib64/libcudnn.so.7 /usr/local/lib/libcudnn.so.7 sudo ldconfig

如果出现如下错误：

CUDA error:out of memory

vi cfg/yolov3.cfg

修改

batch=1

subdivisions=1

保存

如果还是报错，使用更小的权重向量

yolov3-tiny.cfg

下载：

wget https://pjreddie.com/media/files/yolov3-tiny.weights

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
二、YOLO训练与GPU识别的环境搭建

首先要安装好YOLO，再进行下面的GPU识别与训练环境的搭建。如果还未安装YOLO的，请先参考下面链接进行安装：https://blog.csdn.net/yumening77/article/details/97133794以下环境搭建基于ubuntu系统，主要分为三个步骤：显卡驱动的安装 CUDA的安装 CUDNN的安装修改makefile文件...
复制链接

扫一扫

专栏目录

胸毛飘荡 CSDN认证博客专家 CSDN认证企业博客

码龄8年

26: 原创

10万+: 周排名

172万+: 总排名

4万+: 访问

: 等级

729: 积分

20: 粉丝

46: 获赞

13: 评论

182: 收藏

私信

关注

热门文章

分类专栏

最新评论

celery详解
北风之神c: 总结的很全面，写得赞，博主用心了，但主要还是celery太难用了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1)整个项目目录结构, 2）@task入参 ,3）celery的配置，4）celery的配置 include ,5）cmd命令行启动参数 --queues= 的值,6）用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/ ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等19个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，框架包罗万象，一统编程思维，与业务不绑定，适用范围广。 pip install funboost
ThreadPoolExecutor的详解
玉米丛里吃过亏: 可以的，胸毛飘荡
docker中的mysql数据库备份
CSDN-Ada助手: 不知道云原生入门技能树是否可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
五、使用sklearn实现岭回归
m0_63922823: 这个数据该怎么读入引用啊
物体识别——EffcientNet PyTorch的基本使用
EvillivE_: 请问第二步labels_map是干嘛的，那个.txt文件

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。