1.多目标检测算法常用的算法有rcnn,fast-rcnn,yolo,ssd,yolo-v2等,最近出来了yolo-v3
2.FPS:FPS是FramePerSecond的缩写,中文意思是每秒帧数,即帧速。
3. 作为标准数据集,voc-2007 是衡量图像分类识别能力的基准。
faster-rcnn,yolo -v1, yolo-v2都以此数据集为最为演示样例.
VOC数据集共包含:训练集(5011幅),测试集(4952幅),共计9963幅图,共包含20个种类。数据集的组成如下:
Annotations —目标真值区域
ImageSets —-类别标签
JPEGImages —–图像
SegmentationClass
SegmentationObjec
具体信息如下:
具体结构如下:
Annotation
xml
ImageSets
Action
*_train.txt
*_trainval.txt
*_val.txt
Layout
train.txt
trainval.txt
val.txt
Main
*_train.txt
*_trainval.txt
*_val.txt
Segmentation
train.txt
trainval.txt
val.txt
JPEGImages
*.jpg
SegmentationClass
*.png
</