为什么会有虚假唤醒一说。Linux内核这么强大,怎么会出现这样的情况?一直以来也很困惑,看了下文链接中的介绍后,豁然开朗。
从计算机设计的角度,如果一层解决不了,那就再多加一层。推算到这里,就是在表层看不明白时,就需要更深入一层,看它的实现逻辑是怎么样的。
伪代码实现
(以下代码来自pthread_cond_broadcast的man page)
pthread_cond_wait(mutex, cond)
{
value = cond->value; /* 1 */
pthread_mutex_unlock(mutex); /* 2 */
pthread_mutex_lock(cond->mutex); /* 10 */
if (value == cond->value) { /* 11 */
me->next_cond = cond->waiter;
cond->waiter = me;
pthread_mutex_unlock(cond->mutex);
unable_to_run(me);
} else {
pthread_mutex_unlock(cond->mutex); /* 12 */
}
pthread_mutex_lock(mutex); /* 13 */
}
pthread_cond_signal(cond)
{
pthread_mutex_lock(cond->mutex); /* 3 */
cond->value++; /* 4 */
if (cond->waiter) { /* 5 */
sleeper = cond->waiter; /* 6 */
cond->waiter = sleeper->next_cond; /* 7 */
able_to_run(sleeper); /* 8 */
}
pthread_mutex_unlock(cond->mutex); /* 9 */
}
原因分析
按照伪代码实现中的情况,我们同时调用pthread_cond_wait、pthread_cond_signal时,并不一定能直接执行到序号11(导致该睡眠的线程不睡眠),而是有可能运行到序号3到9,之后才能到序号10。
假设A线程调用pthread_cond_wait,B线程调用pthread_cond_signal。从表现上看,是A线程没有睡眠,B线程直接唤起了更早就再在等待的线程(比如线程C)