一、安装
- pytorch==1.7.1
- torchvision-0.8.2
- cuda10.1
git clone https://github.com/Megvii-BaseDetection/YOLOX
conda create -n yolox3.7 python=3.7
source activate yolox3.7
cd YOLOX
git clone https://github.com/NVIDIA/apex
cd apex
pip install https://download.pytorch.org/whl/cu101/torch-1.7.1%2Bcu101-cp37-cp37m-linux_x86_64.whl
pip install https://download.pytorch.org/whl/cu101/torchvision-0.8.2%2Bcu101-cp37-cp37m-linux_x86_64.whl
pip3 install -v --disable-pip-version-check --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./
cd ..
pip3 install -r requirements.txt
python3 setup.py install
pip3 install cython
pip3 install 'git+https://github.com/cocodataset/cocoapi#subdirectory=PythonAPI'
pip install loguru thop tabulate
pip install opencv-python
- 问题
cannot import name 'PILLOW_VERSION' from 'PIL'
,方法conda install pillow==6.1
二、DEMO
python tools/demo.py image -f exps/default/yolox_tiny.py -c yolox_tiny.pth --path image.png --conf 0.5 --nms 0.45 --tsize 640 --save_result --device gpu
- 问题
没有yolox模块
,方法在demo.py里最前面加上import sys和sys.path.append("/home/lwd/code/dl/YOLOX")
- 问题
torch.nn‘ has no attribute ‘SiLU‘
,方法对应行改成module = SiLU()
- 问题
yolox_tiny.pth is a zip archive
,是因为pytorch版本低于1.6,遂决定使用cuda10.1
三、训练自己的数据集
- 参考这篇,使用VOC格式训练
- 先使用labelme给数据打好标签,然后在图片和json文件的目录下运行以下代码
- 需要先新建
saved_path
对应的文件夹
- 和参考博文不一样的是,坐标使用int,因为使用浮点数在训练时会出现错误:
invalid literal for int() with base 10
,错误的原因是直接将浮点型的字符串转成int,比如int('111.0')
,应该是int(float('111.0'))
。
import os
import numpy as np
import codecs
import json
from glob import glob
import cv2
import shutil
from sklearn.model_selection import train_test_split
labelme_path = "./"
saved_path = "./MyVOC/VOC0520/"
if not os.path.exists(saved_path + "Annotations"):
os.makedirs(saved_path + "Annotations")
if not os.path.exists(saved_path + "JPEGImages/"):
os.makedirs(saved_path + "JPEGImages/")
if not os.path.exists(saved_path + "ImageSets/Main/"):
os.makedirs(saved_path + "ImageSets/Main/")
files = glob(labelme_path + "*.json")
files = [i.split(