opencv 多线程parallel_for_

OpenCV 提供了多线程实现的调用函数 parallel_for。有两种调用方法,一种是lambda表达式,另一种是继承cv::ParallelLoopBody 重现 operator() 方法。下面计算两个Mat的反切值作为实例

    int rows = 5120;
    int cols = 5120;
    cv::Mat mat0(rows, cols, CV_32FC1);
    cv::Mat mat1(rows, cols, CV_32FC1);
    cv::randn(mat0, cv::Scalar(0), cv::Scalar(1));
    cv::randn(mat1, cv::Scalar(0), cv::Scalar(1));
    cv::Mat res(rows, cols, CV_32FC1)
    auto ptr0 = mat0.ptr<float>();
    auto ptr1 = mat1.ptr<float>();
    auto ptrR = res.ptr<float>();

 lambda

        cv::parallel_for_(cv::Range(0, res.total()), [&](const cv::Range& range) {
            for (int idx = range.start; idx < range.end; ++idx) {
                ptrR[idx] = std::atan2f(ptr1[idx], ptr0[idx]);
            }
        });

其中lambda [&]表示应用传递参数,里面可以直接使用外面的参数,无返回值函数。

继承cv::ParallelLoopBody

这个相比lambda复杂一些,首先实现一个类

class ParallelPredicate : public cv::ParallelLoopBody {
private:
    cv::Mat mat0;
    cv::Mat mat1;
    cv::Mat& matRes;//引用属性

public:
    ParallelPredicate(cv::Mat& m0, cv::Mat& m1, cv::Mat& mr) :mat0(m0), mat1(m1), matRes(mr) {

    }

    virtual void operator()(const cv::Range& range) const CV_OVERRIDE {
        auto p0 = mat0.ptr<float>();
        auto p1 = mat1.ptr<float>();
        float* pp = matRes.ptr<float>();
        for (int i = range.start; i < range.end; ++i) {
            pp[i] = std::atan2f(p1[i], p0[i]);
        }
    }
};

其中 mat0, mat1,是传入的不变参数,由于matRes的元素值会改变,则matRes需要引用属性。

在 重写的方法中 operator()中写具体的计算过程,range在调用的时候先确定。一下是调用过程,调用时,range的范围已经确定是 0-res.total()。

ParallelPredicate pp(mat0, mat1, res);
cv::parallel_for_(cv::Range(0, res.total()), pp);

设置线程数

    cv::setNumThreads(8);
    int threadNum = cv::getNumThreads();

不同线程数下测试结果

124816
times 493.7  210.5  109.9  63.6  42.4 ms
  • 8
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值