创建数据集
使用labelme
构造voc数据集格式
转换txt为xml
开始训练
sudo nohup ./darknet detector train cfg/voc.data cfg/voc.cfg cfg/darknet53.conv.74 -gpu 0,1,2,3 > out.log 2>&1 &
取十万次的权重
测试
./darknet -i 0 detector test cfg/voc.data cfg/drone2.cfg backup/voc_100000.weights 00000000.jpg -out "cs3222"
放回到Dsp中,进行视频跟踪
复制cfg/drone2.cfg backup/voc_100000.weights cfg/voc.names
效果并不理想,看起来是识别了过大的图片,只识别了直升机,没有识别无人机。
下一步工作,修改数据集,筛去多余的图片(特别大的直升机),然后加上视频中出现的无人机图片。
再次训练
python yolov3_deepsort.py 1.mp4 --config_detection ./configs/drone2.yaml --save_path 1cs
python yolov3_deepsort.py 1.mp4 --config_detection ./configs/drone3.yaml --save_path cs323.mp4
成功识别,但是需要降低置信度,同时修改颜色。
首先调整无人机的识别以及颜色
减低置信度和nms后依旧效果一般
首先需要理解这两个数值,然后可能还要再加一两张图片进行再次的训练。
增加坐标
x1 y1应该是左上角的,而x2 y2则是右下角的。
工作初步完成
后续的具体利用将会使用其进行表情的识别和追踪,到时候会记录一篇详细原理和操作。