《线程是什么》一节讲过,多线程程序中各个线程除了可以使用自己的私有资源(局部变量、函数形参等)外,还可以共享全局变量、静态变量、堆内存、打开的文件等资源。
举个例子,编写一个多线程程序模拟“4个售票员共同卖 10 张票”的过程,代码如下所示:
#include<stdio.h>
#include<stdlib.h>
#include<pthread.h>
//全局变量,模拟总的票数
int ticket_sum = 10;
//模拟4个售票员一起售卖票的过程
void *sell_ticket(void *arg){
int i;
//4个售票员负责将 10 张票全部卖出
for (i = 0; i < 10; i++)
{
//直至所有票全部卖出,4 个售票员才算完成任务
if (ticket_sum > 0)
{
sleep(1);
//每个线程代表一个售票员
printf("%u 卖第 %d 张票\n", pthread_self(), 10 - ticket_sum + 1);
ticket_sum--;
}
}
return 0;
}
int main(){
int flag;
int i;
void *ans;
//创建 4 个线程,代表 4 个售票员
pthread_t tids[4];
for (i = 0; i < 4; i++)
{
flag = pthread_create(&tids[i], NULL, &sell_ticket, NULL);
if (flag != 0) {
printf("线程创建失败!");
return 0;
}
}
sleep(10); // 阻塞主线程,等待所有子线程执行结束
for (i = 0; i < 4; i++)
{
flag = pthread_join(tids[i], &ans);
if (flag != 0) {
printf("tid=%d 等待失败!", tids[i]);
return 0;
}
}
return 0;
}
程序中新建了 4 个子线程,每个线程都可以访问 ticket_sum 全局变量,它们共同执行 sell_ticket() 函数,模拟“4个售票员共同售卖 10 张票”的过程。
每次执行的结果可能是不一样的,我又重复执行了几次,看下图结果
程序执行过程中,出现了“多个售票员卖出同一张票”以及“4个售票员多卖出 3 张票”的异常情况。造成此类问题的根本原因在于,进程中公有资源的访问权限是完全开放的,各个线程可以随时访问这些资源,程序运行过程中很容易出现“多个线程同时访问某公共资源”的情况。
例如,之所以会出现“多个售票员卖出同一张票”的情况,因为这些线程几乎同一时间访问 ticket_sum 变量,得到的是相同的值。出现“4 个售票员多卖出 3 张票”的原因是:4 个线程访问 ticket_sum 变量得到的都是一个大于 0 的数,每个线程都可以继续执行 if 语句内的代码。由于各个线程先后执行的顺序不同,有的线程先执行ticket_sum--
操作,导致其它线程计算10-ticket_sum+1
表达式时,读取到的 ticket_num 变量的值为负数,因此表达式的值会出现大于 10 的情况。
我们通常将“多个线程同时访问某一公共资源”的现象称为“线程间产生了资源竞争”或者“线程间抢夺公共资源”,线程间竞争资源往往会导致程序的运行结果出现异常,感到匪夷所思,严重时还会导致程序运行崩溃。
幸运地是,Linux 提供了很多种解决方案,确定各个线程可以同步访问进程提供的公共资源(简称“线程同步”)。所谓线程同步,简单地理解就是:当一个线程访问某公共资源时,其它线程不得访问该资源,它们只能等待此线程访问完成后,再逐个访问该资源。