本期给大家介绍的是135期基于SSD目标检测模型训练VOC数据集中的行人图片。效果图如下:
代码下载和视频演示地址:
代码是十分的简介,主要是一个datasets数据集文件和4个py文件
运行01数据集制作.py会将data文件夹下的JPEGImages(jpg或png图片)和Annotations(xml标签)读取保存成txt格式,txt文本内存放的就是图片路径和对应的矩形检测框标签。
运行02train.py能够读取txt文本内容结合图片进行训练模型,训练好的模型保存在weights文件夹下。
运行03predict.py可以对单张图片进行检测。
运行04pyqt.py会有个pyqt的可视化界面,通过点击按钮可以加载感兴趣的图片进行识别。
注:
下载本代码环境自行安装
安装python和pytorch即可运行,
安装环境可参考博客:在win10上安装pytorch-gpu版本2-CSDN博客
如需远程安装环境运行,
或讲解逐行代码(小白也能快速掌握理解代码),
或其他需求
都可定制。