一、ssd使用场景及性能分析
目标检测是深度学习图像识别的技术领域,指对单张图片中的物体的类别和位置进行标注。在ssd中,位置信息是通过边界框(bounding-boxes)来描述的。
边界框是一组四个数据,xmin,ymin,xmax,ymax(VOC标准格式)共同描述物体的位置信息。
在PASCAL VOC2007 的测试集上,ssd(300x300)取得了72.1的mAP,已经算是非常精准了,更可贵的是它比Fast、Faster R-CNN更快(经测试SSD在nvidia gtx970m上可以取得近30fps的准确度,接近实时,而faster r-cnn不足10fps)
因此,SSD模型在准确性和实时性上,都具有非常高的实用价值。
二、ssd原理初探
SSD(300x300)的网络结构如图所示。