最近在使用Linux条件变量的时候,经过反复测试发现,pthread_cond_signal有时候会唤起多个正在pthread_cond_wait的线程。后来通过查阅IEEE Std 1003.1, 2004中关于pthread_cond_signal虚假唤醒(spurious wakeup)的解释如下:
On a multi-processor, it may be impossible for an implementation of pthreadcondsignal() to avoid the unblocking of more than one thread blocked on a condition variable.
根据这个解释,在多处理器系统上,pthread_cond_signal是很有可能唤醒多个pthread_cond_wait()的线程(唤醒之后需要获得锁才能返回)。也就意味着当一个线程中,pthread_cond_wait()返回的时候,不一定代表条件已经满足了,需要在程序中做额外的判断来检测是否真的已经满足条件了:
pthread_mutex_lock(&lock);
while (condition_is_false) {
pthread_cond_wait(&cond, &lock);
}
pthread_mutex_unlock(&lock);
事实上,IEEE Std 1003.1, 2004中有提到,虚假唤醒(spurious wakeup)是被允许的,而且鼓励程序开发者在pthread_cond_wait()返回的时候对条件进行重新检查,只有在条件满足的情况下才继续往下执行,否则就需要继续等待了。
关于多处理器系统出现虚假唤醒(sprious wakeup)的原因,我的理解是因为多处理器上,多线程共享的数据需要在多核处理器上cache进行更新和拷贝的原因。关于多核多线程请参考《利用多核多线程进行程序优化》