下面是串行代码:
void SerialApplyFoo( float a[], size_t n ) {
for( size_t i=0; i!=n; ++i )
Foo(a[i]);
}
tbb::parallel_for把迭代空间分成若干块,在每个块上运行独立的线程。第一步形成Body,把它作用在块上,这个Body是一个STL风格的对象,叫做body对象,这个对象里面有个operator()处理一个块,下面的代码是生成body对象:
#include "tbb/tbb.h"
using namespace tbb;
class ApplyFoo {
float *const my_a;
public:
void operator()( const blocked_range<size_t>& r ) const {
float *a = my_a;
for( size_t i=r.begin(); i!=r.end(); ++i )
Foo(a[i]);
}
ApplyFoo( float a[] ) :my_a(a) {}
};
注意operator()参数,库提供的一个blocked_range模板类,它描述的是类型T的一维迭代空间,parallel_for也和其他类型的迭代空间工作,TBB也提供blocked_range2d的2维空间,你能定义自己的空间在3.4章节中。
parallel_for需要body对象有一个拷贝构造函数,它被调用创建一个拷贝为每个工作线程,它也调用析构函数摧毁这些拷贝,在大多情况,隐式产生的拷贝构造函数和析构函数能够工作正常。
因为body对象一定被拷贝,它的operator()不应该改变body里的成员变量,否者这个改变可能或者不可能对其他线程是可见的(产生歧义),作为一个细微的提醒,parallel_for需要body对象的operator()声明成const。
operator()加载my_a成局部变量a。虽然这不是强制的,但是有2个原因需要这样做:
- Style。它让body看起来更像原始的。
- Performance。有时频繁访问局部变量可以帮助编译器优化循环,因为局部变量对编译器来说常常是更容易跟踪的。
一旦你有了body对象,就可以调用模板函数parallel_for:
#include "tbb/tbb.h"
void ParallelApplyFoo( float a[], size_t n ) {
parallel_for(blocked_range<size_t>(0,n), ApplyFoo(a));
}