1. 准备 ONNX 模型
假设你已经有一个训练好的 ONNX 模型文件。可以从各类深度学习框架(如 PyTorch、TensorFlow)中导出 ONNX 模型。例如,下面是一个简单的 PyTorch 模型导出为 ONNX 文件的示例:
import torch
import torchvision.models as models
# Load a pre-trained model (e.g., ResNet18)
model = models.resnet18(pretrained=True)
model.eval()
# Dummy input for tracing
dummy_input = torch.randn(1, 3, 224, 224)
# Export the model to ONNX format
torch.onnx.export(model, dummy_input, "resnet18.onnx")
2. 读取 ONNX 模型
在 OpenCV 中,你可以使用 cv::dnn::readNetFromONNX
函数加载 ONNX 模型。
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
int main() {
// 模型文件路径
std::string modelFile = "resnet18.onnx";
// 从 ONNX 文件中读取模型
cv::dnn::Net net = cv::dnn::readNetFromONNX(modelFile);
// 检查模型是否成功加载
if (net.empty()) {
std::cerr << "Failed to load network!" << std::endl;
return -1;
}
return 0;
}
3. 预处理输入图像
在进行推理之前,需要将输入图像预处理成模型所需的格式。通常,这包括调整图像大小、归一化等。
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
int main() {
// 模型文件路径
std::string modelFile = "resnet18.onnx";
cv::dnn::Net net = cv::dnn::readNetFromONNX(modelFile);
if (net.empty()) {
std::cerr << "Failed to load network!" << std::endl;
return -1;
}
// 读取输入图像
cv::Mat img = cv::imread("image.jpg");
if (img.empty()) {
std::cerr << "Failed to read image!" << std::endl;
return -1;
}
// 将图像调整为模型所需的大小和格式
cv::Mat blob = cv::dnn::blobFromImage(img, 1.0, cv::Size(224, 224), cv::Scalar(104.0, 117.0, 123.0), true, false);
// 设置网络的输入
net.setInput(blob);
// 执行前向传播以获得输出
cv::Mat output = net.forward();
// 输出处理
std::cout << "Output size: " << output.size << std::endl;
return 0;
}
4. 进行推理
在前面的代码中,已经包含了执行推理的步骤。net.forward()
函数会返回模型的输出结果。
5. 处理和显示结果
通常,推理结果需要根据模型的输出进行处理。例如,如果是图像分类模型,你可能需要将输出的向量映射到类别标签
#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
#include <iostream>
int main() {
// 模型文件路径
std::string modelFile = "resnet18.onnx";
cv::dnn::Net net = cv::dnn::readNetFromONNX(modelFile);
if (net.empty()) {
std::cerr << "Failed to load network!" << std::endl;
return -1;
}
// 读取输入图像
cv::Mat img = cv::imread("image.jpg");
if (img.empty()) {
std::cerr << "Failed to read image!" << std::endl;
return -1;
}
// 将图像调整为模型所需的大小和格式
cv::Mat blob = cv::dnn::blobFromImage(img, 1.0, cv::Size(224, 224), cv::Scalar(104.0, 117.0, 123.0), true, false);
// 设置网络的输入
net.setInput(blob);
// 执行前向传播以获得输出
cv::Mat output = net.forward();
// 处理输出
cv::Point classId;
double confidence;
cv::minMaxLoc(output, 0, &confidence, 0, &classId);
std::cout << "Predicted class ID: " << classId.x << std::endl;
std::cout << "Confidence: " << confidence << std::endl;
return 0;
}