前言
博主在测试分析目标检测网络SSD的时候,想知道每个检测框是来自哪个default box
的,因此需要对SSD源码做适当修改,使其在测试时输出相应的信息。SSD算法的介绍有很多博客讲得很好,这里不多说了。这篇博客主要记录了如何用caffe的python接口测试SSD并获取SSD预测框的default box
的索引。
具体步骤
1. 源码修改
首先修改detection_output_layer.cpp
内的某些内容,具体如下:
DetectionOutputLayer<Dtype>::Reshape()
函数内最后的top_shape
的初始维度改为8维
原始
// Each row is a 7 dimension vector, which stores
// [image_id, label, confidence, xmin, ymin, xmax, ymax]
top_shape.push_back(7);
top[0]->Reshape(top_shape);
改为
// Each row is a 8 dimension vector, which stores
// [image_id, label, confidence, xmin, ymin, xmax, ymax, prior_idx]
top_shape.push_back(8);// 这里改成8,代表priorbox的index.
top[0]->Reshape(top_shape);
DetectionOutputLayer<Dtype>::Forward_cpu()
函数中
原始
vector<int> top_shape(2, 1);
top_shape.push_back(num_kept);
top_shape.push_back(7);
Dtype* top_data;
if (num_kept == 0) {
LOG(INFO) << "Couldn't find any detections";
top_shape[2] = num;
top[0]->Reshape(top_shape);
top_data = top[0]->mutable_cpu_data();
caffe_set<Dtype>(top[0]->count(), -1, top_data);
// Generate fake results per image.
for (int i = 0; i < num; ++i) {
top_data[0] = i;
top_data += 7;
}
} else {
top[0]->Reshape(top_shape);
top_data = top[0]->mutable_cpu_data();
}
改为
vector<int> top_shape(2, 1);
top_shape.push_back(num_kept);
top_shape.push_back(8);// 初始维度为8
Dtype* top_data;
if (num_kept == 0) {
LOG(INFO) << "Couldn't find any detections";
top_shape[2] = num;
top[0]->Reshape(top_shape);
top_data = top[0]->mutable_cpu_data();
caffe_set<Dtype>(top[0]->count(), -1, top_data);