TBB、OpenMP对比

1、TBB需要相当可观的重新设计程序,而OpenMP足够简单;

2、TBB不太适合并行化已有的实现(软件),它为新设计的并行程序培养一种好的编程风格和更高的抽象层;

3、在论文的实验中,OpenMP稍稍超过TBB;

4、TBB只能针对C++,  如果程序基于C或者Fortran就用不上了;

5、TBB提供了并行容器,使得结构上的并行更加简单方便;

6、如果您的并行模式主要用于内建类型的有界循环(bounded loop),最好采用 OpenMP;

7、OpenMP需要编译器支持,TBB需要下载运行库;

相关链接:TBB/OpenMP/raw thread三种并发编程的取舍分析

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
DPM(Deformable Part-based Model) Cascade是一种常用的目标检测算法,在OpenCV 3.0中已经支持。在DPM Cascade中,目标被分为多个部分,每个部分用一个分类器来检测,这些分类器被组成一个级联分类器,来提高检测速度和准确率。 TBBOpenMP是常用的多线程库,可以加速DPM Cascade的检测。在使用TBBOpenMP之前,需要先安装它们。在Linux系统中,可以通过以下命令安装: ``` sudo apt-get install libtbb-dev sudo apt-get install libomp-dev ``` 在Windows系统中,可以在Intel官网下载TBBOpenMP的安装程序进行安装。 下面是基于OpenCV 3.0的DPM Cascade检测代码,附带TBBOpenMP加速: ```python import cv2 import numpy as np # 加载级联分类器 cascade = cv2.CascadeClassifier('path/to/cascade.xml') # 加载图像 img = cv2.imread('path/to/image.jpg') # 转换为灰度图像 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 检测目标 rects = cascade.detectMultiScale(gray, scaleFactor=1.3, minNeighbors=3, minSize=(30, 30), flags=cv2.CASCADE_SCALE_IMAGE) # 绘制矩形框 for (x, y, w, h) in rects: cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2) # 显示结果 cv2.imshow('result', img) cv2.waitKey(0) cv2.destroyAllWindows() ``` 加入TBBOpenMP加速的代码如下: ```python import cv2 import numpy as np import time import threading import multiprocessing # 加载级联分类器 cascade = cv2.CascadeClassifier('path/to/cascade.xml') # 加载图像 img = cv2.imread('path/to/image.jpg') # 转换为灰度图像 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 检测目标 start_time = time.time() rects = cascade.detectMultiScale(gray, scaleFactor=1.3, minNeighbors=3, minSize=(30, 30), flags=cv2.CASCADE_SCALE_IMAGE) end_time = time.time() print('串行检测时间:', end_time-start_time) # 绘制矩形框 for (x, y, w, h) in rects: cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2) # 显示结果 cv2.imshow('result', img) cv2.waitKey(0) cv2.destroyAllWindows() # TBB并行检测 def detect_with_tbb(gray, cascade): rects = cascade.detectMultiScale(gray, scaleFactor=1.3, minNeighbors=3, minSize=(30, 30), flags=cv2.CASCADE_SCALE_IMAGE) return rects start_time = time.time() tbb_results = [] tbb = threading.Thread(target=tbb_results.append, args=(detect_with_tbb(gray, cascade),)) tbb.start() tbb.join() end_time = time.time() print('TBB检测时间:', end_time-start_time) # 绘制矩形框 for (x, y, w, h) in tbb_results[0]: cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2) # 显示结果 cv2.imshow('result', img) cv2.waitKey(0) cv2.destroyAllWindows() # OpenMP并行检测 def detect_with_omp(gray, cascade): rects = cascade.detectMultiScale(gray, scaleFactor=1.3, minNeighbors=3, minSize=(30, 30), flags=cv2.CASCADE_SCALE_IMAGE) return rects start_time = time.time() omp_results = [] omp = multiprocessing.Process(target=omp_results.append, args=(detect_with_omp(gray, cascade),)) omp.start() omp.join() end_time = time.time() print('OpenMP检测时间:', end_time-start_time) # 绘制矩形框 for (x, y, w, h) in omp_results[0]: cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2) # 显示结果 cv2.imshow('result', img) cv2.waitKey(0) cv2.destroyAllWindows() ``` 在上面的代码中,我们使用了Python的多线程库threading和多进程库multiprocessing来实现TBBOpenMP的并行化。通过比较串行检测时间和并行检测时间,可以看出TBBOpenMP都可以有效地加速DPM Cascade的检测。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值