本系列博客为英台同学自费科研从装一台新电脑开始研究无人机视角下的目标检测问题的一些记录,牙牙学语阶段,还望各位看文章的大佬们一笑而过。
GitHub源码
软硬件配置
CPU:AMD2600X
GPU:NVIDIA 1660TI 6G
编译环境:Python3.7,pycharm2019.2.4
python模块:keras 2.1.5,tensorflow-gpu 1.14.0(gpu下运行,cpu下运行直接配置tensorflow 1.14.0即可,tensorflow的版本可能会对出现运行出现影响,因其需与cuda对应),numpy 1.17.4,pillow 6.1.0,opencv 4.1.0.25,h5py 2.9.0,matplotlib 3.1.1
配置cuda:10.0
对应cudnn:10.0
迈出第一步
在经历分分钟想杀人的硬件软件配置后,我们终于开始在台式机上开始了程序的第一次运行,由于整个文件夹是从笔记本上直接拷贝过来的,因此之前已经将yolov3.weights的权重下载好,并转化为tensorflow的h5格式。此处注意不要再Pycharm下运行程序,亲测程序运行不会出现bug,但看不到任何结果,我想这应该是作者提供了主程序选择功能的原因,而在cmd环境下选择功能后是可以看到结果的,因此我们首先来看一下help命令是否可行,cmd对应路径下输入:
python yolo_video.py --h
出现以上运行结果,作者在主程序中提供了各项功能,接下来我们逐一对其测试,首先测试图片的检测功能,cmd对应目录下输入:
python yolo_video.py --image
在经过一堆警告后(tensorflow版本问题,真的头疼),提示输入图片名称,对照着输入car.jpg,
在cmd窗口中可以看到程序检测的结果,依次为置信度,(左,上),(右,下)的信息,再看输出的图片:
目前来看一切还算顺利,接着我们测试视频的测试结果,根据help的指示,我们输入:
python yolo_video.py --input [demo.mp4]
此时出现了问题,Couldn’t open webcam or video
该问题笔者认为是因为终端的反馈机制和代码不兼容,我们直接在代码里给出视频的输入地址
持续更新中