OpenCV 提供了多线程实现的调用函数 parallel_for。有两种调用方法,一种是lambda表达式,另一种是继承cv::ParallelLoopBody 重现 operator() 方法。下面计算两个Mat的反切值作为实例
int rows = 5120;
int cols = 5120;
cv::Mat mat0(rows, cols, CV_32FC1);
cv::Mat mat1(rows, cols, CV_32FC1);
cv::randn(mat0, cv::Scalar(0), cv::Scalar(1));
cv::randn(mat1, cv::Scalar(0), cv::Scalar(1));
cv::Mat res(rows, cols, CV_32FC1)
auto ptr0 = mat0.ptr<float>();
auto ptr1 = mat1.ptr<float>();
auto ptrR = res.ptr<float>();
lambda
cv::parallel_for_(cv::Range(0, res.total()), [&](const cv::Range& range) {
for (int idx = range.start; idx < range.end; ++idx) {
ptrR[idx] = std::atan2f(ptr1[idx], ptr0[idx]);
}
});
其中lambda [&]表示应用传递参数,里面可以直接使用外面的参数,无返回值函数。
继承cv::ParallelLoopBody
这个相比lambda复杂一些,首先实现一个类
class ParallelPredicate : public cv::ParallelLoopBody {
private:
cv::Mat mat0;
cv::Mat mat1;
cv::Mat& matRes;//引用属性
public:
ParallelPredicate(cv::Mat& m0, cv::Mat& m1, cv::Mat& mr) :mat0(m0), mat1(m1), matRes(mr) {
}
virtual void operator()(const cv::Range& range) const CV_OVERRIDE {
auto p0 = mat0.ptr<float>();
auto p1 = mat1.ptr<float>();
float* pp = matRes.ptr<float>();
for (int i = range.start; i < range.end; ++i) {
pp[i] = std::atan2f(p1[i], p0[i]);
}
}
};
其中 mat0, mat1,是传入的不变参数,由于matRes的元素值会改变,则matRes需要引用属性。
在 重写的方法中 operator()中写具体的计算过程,range在调用的时候先确定。一下是调用过程,调用时,range的范围已经确定是 0-res.total()。
ParallelPredicate pp(mat0, mat1, res);
cv::parallel_for_(cv::Range(0, res.total()), pp);
设置线程数
cv::setNumThreads(8);
int threadNum = cv::getNumThreads();
不同线程数下测试结果
1 | 2 | 4 | 8 | 16 | ||
times | 493.7 | 210.5 | 109.9 | 63.6 | 42.4 | ms |