Day 14 - 安装与执行 YOLO

Day 14 - 安装与执行 YOLO

介绍影像辨识的处理流程 - Day 10 有提到 YOLO 模型是由 Joseph Redmon 所提出,而到了 YOLOV4 后才换成另外一群人继续发展,YOLOV4 的作者是 Alexey Bochoknovskiy, Chien-Yao Wang, 与 Hong-Yuan Mark Liao,YOLOV5 的作者 Glenn Jocher

安装 YOLO

今天会将 YOLOV3 安装在 Amazon Linux 2,首先从 Joseph Redmon 所建立的 Darknet 进入安装步骤,首先去 darknet 的 github 官网下载套件,接着修改 Makefile 编译组态档,将 GPU,CUDNN 打开,因为这个版本的 AMI 已经有安装 CUDA 等驱动程式,此外还要设定 GPU 架构,因为 gx4n 这类 EC2 使用的是 Tesla T4 的 GPU,所以要去查相对应的架构,可以在 Matching CUDA arch and CUDA gencode for various NVIDIA architectures 这个网站中查到,下图中一个显示 Makefile 的内容,一个透过指令来查 GPU 的使用状况。

git clone https://github.com/pjreddie/darknet.git
cd darknet
# 检查 GPU 的型号与记忆体容量
nvidia-smi
# 修改 Makefile 编译组态档
vi Makefile
make

Makefile

GPU=1 # enable GPU
CUDNN=1 # enable CUDNN
OPENCV=0
OPENMP=0
DEBUG=0

ARCH= -gencode arch=compute_30,code=sm_30 \
      -gencode arch=compute_35,code=sm_35 \
      -gencode arch=compute_50,code=[sm_50,compute_50] \
      -gencode arch=compute_52,code=[sm_52,compute_52]\
      -gencode arch=compute_75,code=[sm_75,compute_75]
# for Tesla T4

在这里插入图片描述
图 1、修改 Makefile 设定

在这里插入图片描述
图 2、检查 GPU 的型号与记忆体容量

执行 YOLO

执行 yolov3 演算法,用来辨识 dog.jpg 这张图片,使用的是事先训练好的模型 yolov3.weights,采用 cfg/yolov3.cfg 的组态设定。

# 下载预先训练好的权重模型
wget https://pjreddie.com/media/files/yolov3.weights
# 注意一下执行的所在文件夹应为 /home/ec2-user/fishRecognition/fishsite/darknet
./darknet detector test cfg/coco.data cfg/yolov3.cfg yolov3.weights data/dog.jpg

下图中可以看出来,总共辨识出三种物件,分别是狗、卡车跟脚踏车,所花的辨识时间为 0.0934 秒,主要是因为有开启 GPU。

在这里插入图片描述
图 3、利用预先训练好的模型来辨识图片

下图为待预测的图片 data/dog.jpg。

在这里插入图片描述
图 4、待预测的图片

下图为预测后的图片,预设会存为 predictions.jpg。

在这里插入图片描述
图 5、预测后的图片

而之所以会辨识为 dog, truck, bicycles,是在 cfg/coco.data 内定义的。

使用 Python 执行 YOLO

我们这里用的方法并不是全部用 Python 重写一遍,而是在 Python 中呼叫 c 语言所提供的呼叫介面,存取 libdarknet.a 这个静态函式库。

darknet 已经将 Python 呼叫 C 语言函式库的介面写好了,放在 python/darknet.py 这个档案里,唯一需要修改的是将 154 行中的语法改成 Python 3的语法,如下图所示。

在这里插入图片描述
图 6、修改 darknet.py 的代码

接着撰写 fishRecognition.py 这个档案,就是把命令列中的参数,都直接放到 Python原始码内就可以。最后呼叫 dn.detect 方法来进行预测。

fishRecognition.py

# 引入 python/darknet.py 
import python.darknet as dn
from datetime import datetime

print('load view model')
net = dn.load_net(str.encode("./cfg/yolov3.cfg"),
                  str.encode("./yolov3.weights"), 1)
meta = dn.load_meta(str.encode("./cfg/coco.data"))
print('start to predict...\n')
n = datetime.now()
r = dn.detect(net, meta, str.encode("./data/dog.jpg"))
print(r, '\n', datetime.now()-n)

下图是执行结果,不只是得到每个物件的名称,准确度,还有方块框的座标,最后一个是我们写来判断预测所花的时间,约 0.11 秒

在这里插入图片描述
图 7、使用 Python 语法呼叫 darknet 函式库

参考资料

  • YOLOv5 Documentation, https://docs.ultralytics.com/
  • Darknet, https://github.com/pjreddie/darknet
  • Installing Darknet, https://pjreddie.com/darknet/install/
  • Matching CUDA arch and CUDA gencode for various NVIDIA architectures, https://arnon.dk/matching-sm-architectures-arch-and-gencode-for-various-nvidia-cards/
  • Calculating Time Difference, https://stackoverflow.com/questions/3426870/calculating-time-difference
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值