一、概述:
1. 在GitHub上下载SSD模型代码
2. 准备自己的VOC数据集
3. 搭建Pytorch环境
4. 用Pytorch框架在Pycharm中跑模型
5. 遇到的问题和解决方法
6. 模型预测效果的检验和检测指标的查看
二、本文使用电脑配置:
硬件:联想拯救者R9000P 2021(R7 5800H/16GB/512GB/RTX3070)
软件:Win10系统、Anaconda3、Python3.8.0、pycharm
Pytorch配置:pytorch1.7.1和torchvision0.8.2
三、详细步骤:
1. 在GitHub上下载SSD模型代码
链接:https://github.com/bubbliiiing/ssd-pytorch
首先前往Github下载对应的仓库,下载完后利用解压软件解压,之后用编程软件打开文件夹。
注意打开的根目录必须正确,否则相对目录不正确的情况下,代码将无法运行。
一定要注意打开后的根目录是文件存放的目录。
2. 准备自己的VOC数据集
本文使用VOC格式进行训练,训练前需要自己制作好数据集,如果没有自己的数据集,可以通过Github连接下载VOC12+07的数据集尝试下。
VOC12+07的数据集链接:
①训练前将标签文件放在VOCdevkit文件夹下的VOC2007文件夹下的Annotation中。
②训练前将图片文件放在VOCdevkit文件夹下的VOC2007文件夹下的JPEGImages中。
然后是数据集的处理:
在完成数据集的摆放之后,我们需要对数据集进行下一步的处理,目的是获得训练用的2007_train.txt以及2007_val.txt,需要用到根目录下的voc_annotation.py。
voc_annotation.py里面有一些参数需要设置。
分别是annotation_mode、classes_path、trainval_percent、train_percent、VOCdevkit_path,第一次训练可以仅修改classes_path,对应指向我们在mode&