从内存读取图片信息跑yolo算法画框

最新推荐文章于 2023-11-14 20:11:25 发布

zhao_927

最新推荐文章于 2023-11-14 20:11:25 发布

阅读量230

点赞数 1

文章标签： c++ Powered by 金山文档

本文链接：https://blog.csdn.net/zhao_927/article/details/129412886

版权

第一步，从内存里将图片信息存放到cv::Mat mat对象里，

//声明一个Mat对象，并且初始化，指定高，宽和格式，这里是8bit，3通道的RGB图像
cv::Mat src_img;
src_img = cv::Mat::zeros(height,width,CV8U3);
//将存在内存的数据copy到src_img里，这里直接采用for循环将数据放到Mat的data成员里
//src_ptr是存放图像的起始指针
for(int i =0;i<height*width*3;++i){
    src_img.data[i] = *(*uint8_t)src_ptr;
}

第2步将内存里的数据送到目的地址，使用取内容操作符和for循环，将数据从src_ptr copy到dst_ptr，也可以使用memcpy的方式，但是memcpy经常会碰到bus error的问题。

第3步，送到目的地址的数据会被运算模块读走，运算模块可以是npu，gpu等，运算输出的结果也被送到另一个地址O_ptr，运算结果输出数据有20*20*85+40*40*85+80*80*85个int8类型数据，需要存储到容器类里，

//先copy数据到3个数组，
uint8_t o_part0[20*20*85];
uint8_t o_part1[40*40*85];
uint8_t o_part2[80*80*85];
...
//将3个数组的内容初始化到容器类对象里
std::vector<int8_t>output_0(o_part0,o_part0+20*20*85);
std::vector<int8_t>output_1(o_part1,o_part1+40*40*85);
std::vector<int8_t>output_2(o_part2,o_part2+80*80*85);
//声明嵌套容器类对象，并将3个vector放到里面
std::vector<std::vector<int8_t>> output_data;
output_data.push_back(output_2);
output_data.push_back(output_1);
output_data.push_back(output_0);

4.第4步，开始调用postprocess函数，output_data容器类作为主要参数传入函数。post_process函数主要包含，filter和nms；

filter()主要功能是过滤掉概率很小的组数据，只留下score分比较高，且80个物体对象最大概率也比较大的几组。nms()主要功能是去掉重复的数据，可能会出现对一个物体多次标记的情况。最

postprocess函数最终返回值是一个map类对象m，key是class_id（某一物体id)，value是一个list，表示的是此物体的所有可能的位置信息，list里的每一个变量都有5个成员，x，y，w，h，score，这5个成员分别是85个数据的前5个。

5.最后把m作为参数和第1步里的src_img作为参数传递到画框函数，draw()，直接修改src_img，将框标在src_img上，然后调用cv::imwrite(result.jpg,src_img)实现把图像输出，可以看到正确的画框。