上次说到打开摄像头出现了灰屏的问题,原因在于如果采用教程中所给的
./darknet detector demo cfg/coco.data cfg/yolo.cfg yolo.weights
指令,识别精度很高,会导致识别时间较长,所以出现了灰屏。等待一会即可。但是基本上出来一幅就是极限了,然后窗口就会失去响应。这个问题的原因等有空再解决。
或者我们可以采用精度低但是速度快的方案
./darknet detector demo cfg/voc.data cfg/tiny-yolo-voc.cfg tiny-yolo-voc.weights
这个方案可以形成视频流(虽然比较卡),但是最终还是会出现窗口没有响应的现象,但是不会立刻失去响应。
下一步是训练。
首先介绍几个概念:
Pascal VOC数据集:(Visual Object Classes)
实际上则是一个比赛:The PASCALVisual Object Classes Challenge
Pascal的全称是Pattern Analysis, Statical Modeling and Computational Learning
http://www.360doc.com/content/13/1227/15/12105052_340543311.shtml
VOC数据集的具体格式:
http://blog.csdn.net/yogyliu/article/details/51859331
http://lib.csdn.net/article/deeplearning/57863?knId=1726
http://blog.csdn.net/burning_keyboard/article/details/71056164
我修改过:
cfg/voc.data
cfg/yolo-voc.cfg
example/yolo.c
scripts/voc_label.py
examples/detector.c
分析:
cfg/voc.data文件
内容(我修改过后的):
train = /home/pjreddie/data/voc/train.txt
valid = /home/pjreddie/data/voc/2007_test.txt
names = data/pasacal.names
backup = backup
class表示你总共要识别多少种东西,他们的名字被存放在name对应的.names文件中(这个文件是一个文本文档,存放在darknet/data文件夹下,是我自己建的)