第一步,从内存里将图片信息存放到cv::Mat mat对象里,
//声明一个Mat对象,并且初始化,指定高,宽和格式,这里是8bit,3通道的RGB图像
cv::Mat src_img;
src_img = cv::Mat::zeros(height,width,CV8U3);
//将存在内存的数据copy到src_img里,这里直接采用for循环将数据放到Mat的data成员里
//src_ptr是存放图像的起始指针
for(int i =0;i<height*width*3;++i){
src_img.data[i] = *(*uint8_t)src_ptr;
}
第2步将内存里的数据送到目的地址,使用取内容操作符和for循环,将数据从src_ptr copy到dst_ptr,也可以使用memcpy的方式,但是memcpy经常会碰到bus error的问题。
第3步,送到目的地址的数据会被运算模块读走,运算模块可以是npu,gpu等,运算输出的结果也被送到另一个地址O_ptr,运算结果输出数据有20*20*85+40*40*85+80*80*85个int8类型数据,需要存储到容器类里,
//先copy数据到3个数组,
uint8_t o_part0[20*20*85];
uint8_t o_part1[40*40*85];
uint8_t o_part2[80*80*85];
...
//将3个数组的内容初始化到容器类对象里
std::vector<int8_t>output_0(o_part0,o_part0+20*20*85);
std::vector<int8_t>output_1(o_part1,o_part1+40*40*85);
std::vector<int8_t>output_2(o_part2,o_part2+80*80*85);
//声明嵌套容器类对象,并将3个vector放到里面
std::vector<std::vector<int8_t>> output_data;
output_data.push_back(output_2);
output_data.push_back(output_1);
output_data.push_back(output_0);
4.第4步,开始调用postprocess函数,output_data容器类作为主要参数传入函数。post_process函数主要包含,filter和nms;
filter()主要功能是过滤掉概率很小的组数据,只留下score分比较高,且80个物体对象最大概率也比较大的几组。nms()主要功能是去掉重复的数据,可能会出现对一个物体多次标记的情况。最
postprocess函数最终返回值是一个map类对象m,key是class_id(某一物体id),value是一个list,表示的是此物体的所有可能的位置信息,list里的每一个变量都有5个成员,x,y,w,h,score,这5个成员分别是85个数据的前5个。
5.最后把m作为参数和第1步里的src_img作为参数传递到画框函数,draw(),直接修改src_img,将框标在src_img上,然后调用cv::imwrite(result.jpg,src_img)实现把图像输出,可以看到正确的画框。