【Yolov8】语义分割 opencv onnxruntime 调用onnx模型推理 c++部署自用

一个看起来就是程序员的昵称

于 2024-07-17 11:29:37 发布

阅读量334

点赞数 2

文章标签： YOLO opencv c++ 计算机视觉人工智能

本文链接：https://blog.csdn.net/qq_45846340/article/details/140489786

版权

环境：opencv4.7.0 onnxruntime1.13.1

opencv安装就不过多解释

onnxruntime1.13.1 链接：https://pan.baidu.com/s/1FBUtcIGnpjdWbg70cysMfQ?pwd=os5o
提取码：os5o

推理模型使用的是官方yolov8n-seg.pt转onnx 也可训练自己项目的模型

识别结果：

Cppinfer.cpp

#include "Cppinfer.h"

using namespace cv;
using namespace std;

cv::Mat sigmoid(const cv::Mat& inputMat)
{
    cv::Mat outputMat;
    cv::exp(-inputMat, outputMat);
    cv::divide(1, 1 + outputMat, outputMat);
    return outputMat;
}

std::wstring ConvertStringToWString(const std::string& s) {
    return std::wstring(s.begin(), s.end());
}

Mat Infer_Img(string modelFilepath, string imageFilepath, float modelScoreThreshold, float modelNMSThreshold, int num_classes)
{
    std::wstring w_model_path = ConvertStringToWString(modelFilepath);

    std::vector<cv::Mat> images;
    auto img = imread(imageFilepath, cv::IMREAD_COLOR);
    images.push_back(img);
    images.push_back(img);
    // Initialize onnxruntime
    Ort::Env env(OrtLoggingLevel::ORT_LOGGING_LEVEL_WARNING, "test");
    Ort::SessionOptions sessionOptions;
    sessionOptions.SetIntraOpNumThreads(1);
    sessionOptions.SetGraphOptimizationLevel(GraphOptimizationLevel::ORT_ENABLE_EXTENDED);
    Ort::Session session(env, w_model_path.c_str(), sessionOptions);

    Ort::AllocatorWithDefaultOptions allocator;
    size_t numInputNodes = session.GetInputCount();
    std::cout << "Input nodes: " << numInputNodes << std::endl;
    const auto ptr = session.GetInputNameAllocated(0, allocator);
    const char* inputName = &*ptr;
    std::cout << "Input name: " << inputName << std::endl;

    size_t numOutputNodes = session.GetOutputCount();
    std::cout << "Output nodes: " << numOutputNodes << std::endl;
    const auto outputptr = session.GetOutputNameAllocated(0, allocator);
    const char* outputName = &*outputptr;
    std::cout << "Output name: " << outputName << std::endl;
    const auto outputptr2 = session.GetOutputNameAllocated(1, allocator);
    const char* outputName2 = &*outputptr2;
    std::cout << "Output name: " << outputName2 << std::endl;
    std::vector<const char*> inputNames{inputName};
    std::vector<const char*> outputNames{outputName, outputName2};

    Ort::MemoryInfo memoryInfo = Ort::MemoryInfo::CreateCpu(
        OrtAllocatorType::OrtArenaAllocator, OrtMemType::OrtMemTypeDefault);

    Ort::TypeInfo inputTypeInfo = session.GetInputTypeInfo(0);
    Ort::TypeInfo outputTypeInfo = session.GetOutputTypeInfo(0);
    Ort::TypeInfo outputTypeInfo2 = session.GetOutputTypeInfo(1);
    auto inputTensorInfo = inputTypeInfo.GetTensorTypeAndShapeInfo();
    auto outputTensorInfo = outputTypeInfo.GetTensorTypeAndShapeInfo();
    auto outputTensorInfo2 = outputTypeInfo2.GetTensorTypeAndShapeInfo();

    std::vector<int64_t> outputDims = outputTensorInfo.GetShape();
    std::vector<int64_t> outputDims2 = outputTensorInfo2.GetShape();
    std::vector<int64_t> inputDims = inputTensorInfo.GetShape();
    std::vector<Ort::Value> input_tensors;

    // Image preprocessing and push to input tensor
    auto start = std::chrono::high_resolution_clock::now();
    cv::Mat blob;
    blob = cv::dnn::blobFromImages(images, 1.0 / 255.0, cv::Size(640, 640), cv::Scalar(), true, false);
    std::cout << "Output name: " << outputName2 << std::endl;
    input_tensors.push_back(Ort::Value::CreateTensor<float>(
        memoryInfo, (float*)blob.data, inputDims[0] * inputDims[1] * inputDims[2] * inputDims[3], inputDims.data(),
        inputDims.size()));

    auto end = std::chrono::high_resolution_clock::now();
    auto duration = std::chrono::duration_cast<std::chrono::milliseconds>(end - start);
    std::cout << "Preprocessing time: " << duration.count() << " milliseconds" << std::endl;

    // Output tensor preprocessing
    std::cout << outputDims[2] << std::endl;
    std::vector<float> outputTensorValues(outputDims[0] * outputDims[1] * outputDims[2]);
    std::vector<Ort::Value> output_tensors;
    output_tensors.push_back(Ort::Value::CreateTensor<float>(
        memoryInfo, outputTensorValues.data(), outputDims[0] * outputDims[1] * outputDims[2], outputDims.data(), outputDims.size()));
    std::vector<float> outputTensorValues2(outputDims2[0] * outputDims2[1] * outputDims2[2] * outputDims2[3]);
    output_tensors.push_back(Ort::Value::CreateTensor<float>(
        memoryInfo, outputTensorValues2.data(), outputDims2[0] * outputDims2[1] * outputDims2[2] * outputDims2[3], outputDims2.data(), outputDims2.size()));

    // Inference
    session.Run(Ort::RunOptions{nullptr}, inputNames.data(),
        input_tensors.data(), 1 /*Number of inputs*/, outputNames.data(),
        output_tensors.data(), 2 /*Number of outputs*/);

    start = std::chrono::high_resolution_clock::now();

    // Get inference results
    Ort::Value& tensor = output_tensors[0];
    auto shape = tensor.GetTensorTypeAndShapeInfo().GetShape();
    float* data = tensor.GetTensorMutableData<float>();
    cv::Mat mat(shape[1], shape[2], CV_32F, data);
    int rows = shape[2];
    int dimensions = shape[1];
    std::vector<int> class_ids;
    std::vector<float> confidences;
    std::vector<cv::Rect> boxes;
    cv::transpose(mat, mat);
    data = (float*)mat.data;
    std::vector<int> num_index;

    // Get output box coordinates
    for (int i = 0; i < rows; ++i)
    {
        float* classes_scores = data + 4;

        cv::Mat scores(1, num_classes, CV_32FC1, classes_scores);
        cv::Point class_id;
        double maxClassScore;

        minMaxLoc(scores, 0, &maxClassScore, 0, &class_id);

        if (maxClassScore > modelScoreThreshold)
        {
            confidences.push_back(maxClassScore);
            class_ids.push_back(class_id.x);

            float x = data[0];
            float y = data[1];
            float w = data[2];
            float h = data[3];

            int left = int((x - 0.5 * w));
            int top = int((y - 0.5 * h));

            int width = int(w);
            int height = int(h);
            num_index.push_back(i);
            boxes.push_back(cv::Rect(left, top, width, height));
        }
        data += dimensions;
    }

    // Non-maximum suppression
    std::vector<int> nms_result;
    cv::dnn::NMSBoxes(boxes, confidences, modelScoreThreshold, modelNMSThreshold, nms_result);
    cv::Mat mask(640, 640, CV_8UC1, cv::Scalar(0));
    std::vector<Detection> detections{};

    // Get the final results
    for (unsigned long i = 0; i < nms_result.size(); ++i)
    {
        int idx = nms_result[i];

        Detection result;
        result.class_id = class_ids[i];
        result.confidence = confidences[idx];

        std::uniform_int_distribution<int> dis(100, 255);
        result.color = cv::Scalar(111, 222, 111);
        // TODO
        result.className = "1";
        result.box = boxes[idx];
        std::copy((float*)mat.data + dimensions * num_index[nms_result[i]] + 4 + num_classes, (float*)mat.data + dimensions * num_index[nms_result[i]] + 4 + num_classes + 32, result.mask);
        detections.push_back(result);
    }

    Ort::Value& tensor2 = output_tensors[1];
    auto shape2 = tensor2.GetTensorTypeAndShapeInfo().GetShape();

    float* data2 = tensor2.GetTensorMutableData<float>();
    float* maskptr = tensor2.GetTensorMutableData<float>();
    cv::Mat maskMat(shape2[1], shape2[2] * shape2[3], CV_32F, maskptr);

    // Mask post-processing
    for (auto detection : detections) {
        cv::Mat tmpMat(1, 32, CV_32F, detection.mask);
        cv::Mat tmpResult;
        cv::gemm(tmpMat, maskMat, 1.0, cv::Mat(), 0, tmpResult);
        cv::Mat reshapedImage = tmpResult.reshape(1, 160);
        cv::Mat sigmoidMat = sigmoid(reshapedImage);  // Calculate Sigmoid
        cv::Mat mat(160, 160, CV_8UC1, cv::Scalar(0));

        cv::Rect rfor4(int(detection.box.x / 4), int(detection.box.y / 4), int(detection.box.width / 4), int(detection.box.height / 4));
        cv::Mat roi = sigmoidMat(rfor4);
        cv::Mat crop_mask;
        cv::resize(roi, crop_mask,
            cv::Size(detection.box.width, detection.box.height),
            cv::INTER_CUBIC);
        cv::Size kernelSize(3, 3);  // Blur kernel size
        cv::Mat blurredImage;
        cv::blur(crop_mask, blurredImage, kernelSize);
        // Create a grayscale image with size 640x640
        cv::Mat thresholdMat;
        cv::threshold(blurredImage, thresholdMat, 0.5, 255, cv::THRESH_BINARY);
        thresholdMat.convertTo(thresholdMat, CV_8UC1);

        cv::Mat roi2 = mask(cv::Rect(int(detection.box.x), int(detection.box.y), int(detection.box.width), int(detection.box.height)));
        std::cout << cv::Rect(int(detection.box.x), int(detection.box.y), int(detection.box.width), int(detection.box.height)) << std::endl;
        thresholdMat.copyTo(roi2);
    }
    end = std::chrono::high_resolution_clock::now();

    // Calculate the time difference
    duration = std::chrono::duration_cast<std::chrono::milliseconds>(end - start);

    // Output execution time
    std::cout << "Postprocessing time: " << duration.count() << " milliseconds" << std::endl;

    return mask;
}

Mat post_processing(Mat img,Mat mask,int num_classes)
{
    Mat resized_mask;
    int original_height = img.rows;
    int original_width = img.cols;
    cv::resize(mask, resized_mask, cv::Size(original_width, original_height), 0, 0, cv::INTER_NEAREST);
    std::mt19937 rng(std::random_device{}());

    std::vector<cv::Vec3b> colors(num_classes);
    for (int i = 0; i < num_classes; ++i) {
        colors[i] = cv::Vec3b(rng() % 256, rng() % 256, rng() % 256);
    }

    // 将 mask 转换为彩色图像
    cv::Mat colored_mask(original_height, original_width, CV_8UC3);
    for (int i = 0; i < original_height; ++i) {
        for (int j = 0; j < original_width; ++j) {
            colored_mask.at<cv::Vec3b>(i, j) = colors[resized_mask.at<uchar>(i, j)];
        }
    }

    // 叠加透明度 alpha
    double alpha = 0.5;
    cv::Mat overlay;
    cv::addWeighted(img, 1 - alpha, colored_mask, alpha, 0, overlay);

    return overlay;
    // 显示或保存结果

}

Cppinfer.h

#pragma once
#include <opencv2/opencv.hpp>
#include <onnxruntime_cxx_api.h>
#include <chrono>
#include <iostream>
#include <random>

using namespace cv;
using namespace std;

struct Detection
{
    int class_id{ 0 };
    std::string className{};
    float confidence{ 0.0 };
    cv::Scalar color{};
    cv::Rect box{};
    float mask[32];
};
cv::Mat sigmoid(const cv::Mat& inputMat);
std::wstring ConvertStringToWString(const std::string& s);
Mat Infer_Img(string modelFilepath, string imageFilepath, float modelScoreThreshold, float modelNMSThreshold, int num_classes);
Mat post_processing(Mat img, Mat mask, int num_classes);

main.cpp


#include "Cppinfer.h"

using namespace cv;

int main()
{
    // Load the model and image
    std::string modelFilepath{"models\\yolov8n-seg.onnx"};//模型路径
    std::string imageFilepath{"images\\1.png"};//图片路径
    std::string saveFilepath{"result\\result.png"};//结果保存路径
    Mat img = imread(imageFilepath);
    int num_classes = 80;
    // Set thresholds
    float modelScoreThreshold = 0.5;
    float modelNMSThreshold = 0.5;
    Mat mask = Infer_Img(modelFilepath, imageFilepath, modelScoreThreshold, modelNMSThreshold, num_classes);

    Mat result = post_processing(img, mask, num_classes);

    cv::imshow("Segmentation Result", result);
    cv::waitKey(0);
}

一个看起来就是程序员的昵称

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

【Yolov8】语义分割 opencv onnxruntime 调用onnx模型推理 c++部署 自用

【Yolov8】语义分割 opencv onnxruntime 调用onnx模型推理 c++部署自用