缓冲区不能为空。参数名: buffer_为什么pthread_cond_wait需要互斥锁mutex作为参数...

最新推荐文章于 2021-06-30 16:48:04 发布

weixin_39618730

最新推荐文章于 2021-06-30 16:48:04 发布

阅读量453

点赞数 1

文章标签：缓冲区不能为空。参数名: buffer

通常的应用场景下，当前线程执行pthread_cond_wait时，一定是处于某个临界区，正在访问共享资源，存在一个mutex与该临界区相关联。因此，在阻塞前，必须释放mutex；被唤醒后，仍然处于临界区，因此需要再次获得mutex。

为什么是pthread_cond_wait(cond, mutex)而不是pthread_cond_wait(cond)
生产者和消费者问题的介绍
用于同步和互斥的全局变量
使用pthread_cond_wait(cond)解决生产者和消费者问题(第一版)
使用pthread_cond_wait(cond)解决生产者和消费者问题(第二版)
使用pthread_cond_wait(cond, mutex)解决生产者和消费者问题
完整可编译运行的程序
程序运行结果

1. 为什么是pthread_cond_wait(cond, mutex)而不是pthread_cond_wait(cond)

我当初学习条件变量时，也有过和楼主相同的疑问，在上操作系统实践课程时，班上的个别学生也问过这个问题。相信这是一个初学者的共性问题，但很少有书籍仔细解释这个问题。

为什么pthread_cond_wait的api被设计为

int pthread_cond_wait(pthread_cond_t *cond, pthread_mutex_t *mutex);

而不是被设计为

int pthread_cond_wait(pthread_cond_t *cond);

pthread_cond_wait(cond, mutex)的功能有3个：

调用者线程首先释放mutex
然后阻塞，等待被别的线程唤醒
当调用者线程被唤醒后，调用者线程会再次获取mutex

pthread_cond_wait(cond)的功能只有1个：

调用者线程阻塞，等待被别的线程唤醒。

这里首先给一个简洁的回答：

通常的应用场景下，当前线程执行pthread_cond_wait时，处于临界区访问共享资源，存在一个mutex与该临界区相关联，这是理解pthread_cond_wait带有mutex参数的关键
当前线程执行pthread_cond_wait前，已经获得了和临界区相关联的mutex；执行pthread_cond_wait会阻塞，但是在进入阻塞状态前，必须释放已经获得的mutex，让其它线程能够进入临界区
当前线程执行pthread_cond_wait后，阻塞等待的条件满足，条件满足时会被唤醒；被唤醒后，仍然处于临界区，因此被唤醒后必须再次获得和临界区相关联的mutex

综上，调用pthread_cond_wait时，线程总是位于某个临界区，该临界区与mutex相关，pthread_cond_wait需要带有一个参数mutex，用于释放和再次获取mutex。

本文的剩下部分将通过一个具体的应用场景来说明，为什么pthread_cond_wait需要一个看似多余的mutex参数。

2. 生产者和消费者问题的介绍

存在一个共享缓冲区，生产者向共享缓冲区写入数据，消费者从共享缓冲区中读取数据。

生产者和消费者存在同步关系：当共享缓冲区为满时，生产者需要等待，等待消费者从共享缓冲区取走数据；当共享缓冲区为空时，消费者需要等待，等待生产者向共享缓冲区中写入数据。

使用环形队列实现共享缓冲区，数据结构如下：

#define CAPACITY 8     // 缓冲区的最大容量
int buffer[CAPACITY];  // 缓冲区数组
int in;                // 缓冲区的写指针
int out;               // 缓冲区的读指针
int size;              // 缓冲区中的数据个数

缓冲区的相关代码如下

void buffer_init()
{
    in = 0;
    out = 0;
    size = 0;
}

// 判断缓冲区是否为空
int buffer_is_empty()
{
    return size == 0; 
}

// 判断缓冲区是否为满
int buffer_is_full()
{
    return size == CAPACITY; 
}

// 向缓冲区中追加一个数据
void buffer_put(int item)
{
    buffer[in] = item;
    in = (in + 1) % CAPACITY;
    size++;
}

// 从缓冲区中取走一个数据
int buffer_get()
{
    int item;

    item = buffer[out];
    out = (out + 1) % CAPACITY;
    size--;

    return item;
}

如果存在多个生产者和多个消费者，变量in、out和size会被它们共享访问，因此生产者和消费者还存在互斥关系：

当某个生产者执行buffer_is_full、buffer_put时，访问了变量in、out和size，只能允许该生产者独占访问这三个变量，禁止其他生产者和消费者访问这些共享变量。
当某个消费者执行buffer_is_empty、buffer_get时，访问了变量in、out和size，只能允许该消费者独占访问这三个变量，禁止其他生产者和消费者访问这些共享变量。

3. 用于同步和互斥的全局变量

总结以上

生产者和消费者中存在有同步关系，需要使用pthread_cond_wait和pthread_cond_signal解决
生产者和消费者中存在有互斥关系，需要使用pthread_mutex_lock和pthread_mutex_unlock解决

程序中需要引入两个全局变量cond和mutex用于同步和互斥

pthread_cond_t cond;
pthread_mutex_t mutex;

4. 使用pthread_cond_wait(cond)解决生产者和消费者问题(第一版)

下面我们尝试使用没有mutex参数的pthread_cond_wait来模拟生产者消费者，假想中没有mutex参数的pthread_cond_wait原型如下：

int pthread_cond_wait(pthread_cond_t *cond);

pthread_cond_wait(cond)的功能非常简单，仅仅阻塞当前线程。在生产者消费者这个应用场景中，很快就能发现pthread_cond_wait(cond)的问题。

使用pthread_cond_wait(cond)解决生产者和消费者问题的代码如下：

// 生产者线程执行的流程
void producer_loop()
{
    int i;

    // 生产CAPACITY*2个数据
    for (i = 0; i < CAPACITY*2; i++) {  
        pthread_mutex_lock(&mutex);

        // 当缓冲区为满时，生产者需要等待
        while (buffer_is_full()) {   
            // 当前线程已经持有了mutex，调用pthread_cond_wait阻塞，必然导致死锁
            pthread_cond_wait(&cond);
        }

        // 此时，缓冲区肯定不是满的，向缓冲区写数据
        buffer_put(i);

        pthread_mutex_unlock(&mutex);        

        // 缓冲区的状态发生了变化，唤醒其它的生产者或消费者
        pthread_cond_signal(&cond);
    }
}

// 消费者线程执行的流程
void consumer_loop()
{
    int i;

    // 消费CAPACITY*2个数据
    for (i = 0; i < CAPACITY*2; i++) {  
        pthread_mutex_lock(&mutex);

        // 当缓冲区为空时，消费者需要等待
        while (buffer_is_empty()) {   
            // 当前线程已经持有了mutex，调用pthread_cond_wait阻塞，必然导致死锁
            pthread_cond_wait(&cond);
        }

        // 此时，缓冲区肯定不是空的，从缓冲区取数据
        int item = buffer_get();

        pthread_mutex_unlock(&mutex);        

        // 缓冲区的状态发生了变化，唤醒其它的生产者或消费者
        pthread_cond_signal(&cond);
    }
}

以上程序存在一个会导致死锁的严重错误，以生产者为例：

当前缓冲区已经满了，生产者运行，首先获取mutex
然后检测buffer_is_full为真，生产者无法放入数据
调用pthread_cond_wait，该生产者进入阻塞状态，等待被消费者唤醒
消费者试图获取mutex，由于mutex已经被占用了，消费者将进入阻塞状态
生产者和消费者均进入阻塞状态，系统死锁

5. 使用pthread_cond_wait(cond)解决生产者和消费者问题(第二版)

为了解决死锁的问题，需要对上一节的程序进行如下改进

调用线程调用pthread_cond_wait(cond)前，已经持有了mutex
执行pthread_cond_wait(cond)前，调用pthread_unlock(mutex)释放mutex
执行pthread_cond_wait(cond)后，调用pthread_lock(mutex)再次获得mutex

// 生产者线程执行的流程
void producer_loop()
{
    int i;

    // 生产CAPACITY*2个数据
    for (i = 0; i < CAPACITY*2; i++) {  
        pthread_mutex_lock(&mutex);

        // 当缓冲区为满时，生产者需要等待
        while (buffer_is_full()) {   
            pthread_mutex_unlock(&mutex);
            pthread_cond_wait(&cond);
            pthread_mutex_lock(&mutex);
        }

        // 此时，缓冲区肯定不是满的，向缓冲区写数据
        buffer_put(i);

        pthread_mutex_unlock(&mutex);        

        // 缓冲区的状态发生了变化，唤醒其它的生产者或消费者
        pthread_cond_signal(&cond);
    }
}

// 消费者线程执行的流程
void consumer_loop()
{
    int i;

    // 消费CAPACITY*2个数据
    for (i = 0; i < CAPACITY*2; i++) {  
        pthread_mutex_lock(&mutex);

        // 当缓冲区为空时，消费者需要等待
        while (buffer_is_empty()) {   
            pthread_mutex_unlock(&mutex);
            pthread_cond_wait(&cond);
            pthread_mutex_lock(&mutex);            
        }

        // 此时，缓冲区肯定不是空的，从缓冲区取数据
        int item = buffer_get();

        pthread_mutex_unlock(&mutex);        

        // 缓冲区的状态发生了变化，唤醒其它的生产者或消费者
        pthread_cond_signal(&cond);
    }
}

这里解释一下为什么线程调用pthread_cond_wait返回后，需要再次调用pthread_mutex_lock获取锁。以生产者为例，以下为生产者向buffer中追加数据的代码段：

// 生产者向buffer中追加数据
pthread_mutex_lock(&mutex);
while (buffer_is_full()) {   
    pthread_mutex_unlock(&mutex);
    pthread_cond_wait(&cond);
    pthread_mutex_lock(&mutex);
}
buffer_put(i);
pthread_mutex_unlock(&mutex);

在上面这段代码中，生产者线程会调用buffer_is_full和buffer_put，访问共享变量in、out和size。必须保证线程以独占的方式访问这些共享变量，即线程在调用buffer_is_full和buffer_put前必须持有锁。线程从pthread_cond_wait返回后，调用pthread_mutex_lock再次获得锁，然后执行语句while (buffer_is_full())时，因为已经拥有了锁，所以通过buffer_is_full访问共享变量是安全的。

6. 使用pthread_cond_wait(cond, mutex)解决生产者和消费者问题

在上一个版本的程序中，生产者和消费者中存在如下代码段

// 先释放mutex、再阻塞、最后再次获取mutex
pthread_mutex_unlock(&mutex);
pthread_cond_wait(&cond);
pthread_mutex_lock(&mutex);

从这个应用场景来看，pthread_cond_wait被设计为带有mutex参数，用一次函数调用pthread_cond_wait(cond, mtex)即可实现以上三条语句的功能。

使用pthread_cond_wait(cond, mutex)解决生产者和消费者问题的代码如下：

// 生产者线程执行的流程
void producer_loop()
{
    int i;

    // 生产CAPACITY*2个数据
    for (i = 0; i < CAPACITY*2; i++) {  
        pthread_mutex_lock(&mutex);

        // 当缓冲区为满时，生产者需要等待
        while (buffer_is_full()) {   
            // 当前线程已经持有了mutex，首先释放mutex，然后阻塞，醒来后再次获取mutex            
            pthread_cond_wait(&cond, &mutex);
        }

        // 此时，缓冲区肯定不是满的，向缓冲区写数据
        buffer_put(i);

        pthread_mutex_unlock(&mutex);        

        // 缓冲区的状态发生了变化，唤醒其它的生产者或消费者
        pthread_cond_signal(&cond);
    }
}

// 消费者线程执行的流程
void consumer_loop()
{
    int i;

    // 消费CAPACITY*2个数据
    for (i = 0; i < CAPACITY*2; i++) {  
        pthread_mutex_lock(&mutex);

        // 当缓冲区为空时，消费者需要等待
        while (buffer_is_empty()) {  
            // 当前线程已经持有了mutex，首先释放mutex，然后阻塞，醒来后再次获取mutex 
            pthread_cond_wait(&cond, &mutex);
        }

        // 此时，缓冲区肯定不是空的，从缓冲区取数据
        int item = buffer_get();

        pthread_mutex_unlock(&mutex);        

        // 缓冲区的状态发生了变化，唤醒其它的生产者或消费者
        pthread_cond_signal(&cond);
    }
}

7. 完整可编译运行的程序

#include <stdio.h>
#include <pthread.h>

#define CAPACITY 8     // 缓冲区的最大容量
int buffer[CAPACITY];  // 缓冲区数组
int in;                // 缓冲区的写指针
int out;               // 缓冲区的读指针
int size;              // 缓冲区中的数据个数

void buffer_init()
{
    in = 0;
    out = 0;
    size = 0;
}

// 判断缓冲区是否为空
int buffer_is_empty()
{
    return size == 0; 
}

// 判断缓冲区是否为满
int buffer_is_full()
{
    return size == CAPACITY; 
}

// 向缓冲区中追加一个数据
void buffer_put(int item)
{
    buffer[in] = item;
    in = (in + 1) % CAPACITY;
    size++;
}

// 从缓冲区中取走一个数据
int buffer_get()
{
    int item;

    item = buffer[out];
    out = (out + 1) % CAPACITY;
    size--;

    return item;
}

pthread_cond_t cond;
pthread_mutex_t mutex;

// 生产者线程执行的流程
void *producer_loop(void *arg)
{
    int i;

    // 生产CAPACITY*2个数据
    for (i = 0; i < CAPACITY*2; i++) {       
    printf("produce %dn", i);
        pthread_mutex_lock(&mutex);

        // 当缓冲区为满时，生产者需要等待
        while (buffer_is_full()) {   
            // 当前线程已经持有了mutex，首先释放mutex，然后阻塞，醒来后再次获取mutex
            pthread_cond_wait(&cond, &mutex);
        }

        // 此时，缓冲区肯定不是满的，向缓冲区写数据
        buffer_put(i);
        pthread_mutex_unlock(&mutex);        

        // 缓冲区的状态发生了变化，唤醒其它的生产者或消费者
        pthread_cond_signal(&cond);
    }

    return NULL;
}

// 消费者线程执行的流程
void *consumer_loop(void *arg)
{
    int i;

    // 消费CAPACITY*2个数据
    for (i = 0; i < CAPACITY*2; i++) {  
        pthread_mutex_lock(&mutex);

        // 当缓冲区为空时，消费者需要等待
        while (buffer_is_empty()) {   
            // 当前线程已经持有了mutex，首先释放mutex，然后阻塞，醒来后再次获取mutex
            pthread_cond_wait(&cond, &mutex);
        }

        // 此时，缓冲区肯定不是空的，从缓冲区取数据
        int item = buffer_get();
        pthread_mutex_unlock(&mutex);        

        // 缓冲区的状态发生了变化，唤醒其它的生产者或消费者
        pthread_cond_signal(&cond);

    printf("tconsume %dn", item);
    }

    return NULL;
}

int main()
{
    pthread_t producer;
    pthread_t consumer;

    buffer_init();
    pthread_create(&producer, NULL, producer_loop, NULL);
    pthread_create(&consumer, NULL, consumer_loop, NULL);

    pthread_join(producer, NULL);
    pthread_join(consumer, NULL);
    return 0;
}

8. 程序运行结果

root@linuxmooc:~# cc -o thread thread.c -lpthread
root@linuxmooc:~# ./thread
produce 0
produce 1
produce 2
produce 3
produce 4
produce 5
produce 6
produce 7
produce 8
produce 9
        consume 0
        consume 1
        consume 2
        consume 3
        consume 4
        consume 5
        consume 6
        consume 7
        consume 8
produce 10
produce 11
produce 12
produce 13
produce 14
produce 15
        consume 9
        consume 10
        consume 11
        consume 12
        consume 13
        consume 14
        consume 15