假设我们在代码中有两次async()函数调用,为方便说明,我们为async函数按调用次序加编号:
auto f1 = async_1(foo_1);
auto f2 = async_2(foo_2);
async_1()肯定比async_2()先执行,但foo_1()缺不一定比foo_2()先执行。
再看一个例子,
//一个全局变量,主线程和异步线程都会操作它
int N = 0;
//异步操作
void DecN()
{
--N;
}
///主函数,主线程
int main()
{
auto f = async(DecN);
++N;
cout << (N/N == 1) << endl;
f.wait();
return 0;
}
015行,在计算N/N时,N的值是什么?如果异步调用DecN()来得及运行完毕,N是1;如果DecN()来不及运行,N是0,这个情况下,会发生“除零错”造成程序异常退出。考虑到异步操作需要启动线程的时间成本,因此N为1的比例极大,但就有可能在程序员正度婚假时,它发生了。
有人说,我不会轻易使用去全局变量。如果结合数据传递,隐患更隐秘了:
//异步操作
void DecN(int& n) ///此处传址
{
--n;
cout << n << endl; ///这里输出什么
}
///主函数,主线程
int main()
{
int N(0);
auto f = async(DecN, std::ref(N)); //这里“接”收N
++N;
f.wait();
}
011行,async接走了局部变量N,接的时候N还是0,但由于目标过程DecN(n)需要的是一个引用(所以必须用std::ref()小工具),这就有极大的可能是在DecN时,它再访问时,012行已经执行完毕,所以此N已经是1。
【重要】:future <T>对象的析构
如果上面的代码没有调用f.wait(),情况会怎样?试分析:①main()函数会在012行后直接退出;②然后栈变量N消失;③若此时async正好启动DecN(),正要通过“引用(内存地址)”访问N,④所以最终访问到一块已经释放的“幽灵”内存。
这个分析是错的。
future <T>对象的析构过程中会检查是否调用过get()或wait(),如果没有则自动调用。在main()函数中,f 的析构先于N的释放,保证了异步过程对N的正常访问。
并发程序最容易出错的地方,就是不同线程操作相同的资源,由于时序的不可确定性,很难清楚地知道最后是哪个线程对资源进了修改;
处理之道是尽量避免这样的时序依赖,尽量减少在不同线程上同期操作相同资源,除非所有线程都只是读取该资源,而非修改。
线程之间传递数据,应按如下次序考虑:
①推荐:优先考虑传值(即复制)方式,根源上消灭“跨线程共用资源”;
②推荐:考虑使用shared_ptr;
③不推荐:常量传址方式,即“T const&(常量引用)”或“T const* (常量指针)* ”;
④不推荐:使用传址方式,即“T&”或“T*”。