1.什么是线程,为什么要引入线程?
🎤 最开始的操作系统,程序只能串行的访问,无法多个程序同时使用,而引入了进程之后,可以实现多个程序之间的并发。但是一个程序里包含很多事务要做,比如用QQ的时候,可能既要发短信,又要视频聊天还要发文件,进程是一次执行的过程,不可能让进程里的好几个功能同时实现,每次只能执行一个进程中的一个功能。所以为了让一个程序能够实现同时执行好几个功能,引入了线程。
⛵️ 有的进程可能需要“同时”做很多事,而传统的进程只能穿行地执行一系列程序,为此,加入了线程,来增加并发度。之前进程是程序执行流地最小单位。现在线程是CPU执行执行单元,也是程序执行流的最小单元。CPU执行的时候执行的是每个进程中的线程。
😃 有了线程之后,不仅是进程之间可以并发了,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频,聊天,传文件)
:happy: 引入线程后,进程只作为除CPU之外的系统资源的分配单元(如打印机、内存地址空间都是分配给进程的,进程内的线程共享这些资源)
2.引入线程机制后,有什变化?
🌟 资源分配、调度:
- 传统进程资源中,进程是资源分配、调度的基本单位
- 引入线程后,进程是资源分配的基本单位,线程是调度的基本单位
🌠 并发性:
- 传统进程机制中,只能进程间并发
- 引入线程后,各线程间也能并发,提升了并发度
✴️ 系统开销:
- 传统的进程间并发,需要切换进程的运行环境、系统开销大。(上网课和教室中上课,同样是上课,这变化可就太大了)
- 线程间并发,如果是同一个进程内的线程切换,则不需要切换进程环境,系统开销小
- 引入线程后,并发所带来的系统开销小
3. 线程的属性
- 线程是处理机调度的基本单位
- 多个CPU计算机中,各个线程可占用不同的CPU
- 每个线程都有一个线程ID,线程控制块(TCB)----> 和进程差不多,该有的都有
- 线程也有就绪、阻塞、运行三种基本状态
- 线程几乎不用有系统资源
- 统一进程的不同进程间共享进程的资源
- 由于共享内存地址空间,所以同一进程中的线程间通信基本无需系统干预,可以互用
- 同一进程中的线程切换、不会引起进程切换
- 不同进程中的线程切换,会引起进程切换
- 切换同进程中的线程,系统开销很小
- 切换进程,系统开销较大
4. 线程的实现方式
⭐️ 用户级线程:早期的操作系统只支持进程,不支持线程。当时的“线程”是由线程库实现的(逻辑上的线程)。
void solve()
{
int i = 0;
while (true)
{
if (i == 0)
cout << "处理视频聊天的代码";
else if (i == 1)
cout << "处理文字聊天的代码";
else
cout << "处理文件传输的代码";
i = (i + 1) % 3;
}
}
这就相当于一个线程库,线程库里由三个线程,分别属于三个功能。线程库完成了对线程的管理工作(如调度)。
很多编程语言提供了强大的线程库,可以实现线程的创建、销毁、调度的过程。
🐟 特点:
- 线程的管理工作是由应用程序中的线程库完成的,而不是操作系统
- 线程切换也不需要CPU变态,线程切换是由
while
循环管理的,不需要操作系统的干涉。 - 操作系统不知道用户级线程的存在,只知道包含这几个线程的进程,这也就是为什么叫用户级线程,因为只有用户才知道自己有哪些线程。
🍺 优点:线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。
🍔 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,虽然他们被分为三个线程,但还是属于一个整体进程,这个进程才是CPU调度的基本单位,一个阻塞了,全都阻塞了,这就导致并发度不搞了。而且如果有多个处理机的话,这个线程库里的线程也只能在一个处理机上执行,大大浪费了CPU资源。
⭐️ 内核级线程
🍌 特点
- 线程是被操作系统内核管理的
- 线程调度、切换等工作都由内核复杂,因此内核级线程切换的话就需要变态后才能完成。
- 操作系统会为每个内核级线程建立相应的TCB,通过TCB对线程进行管理,”内核级线程“就是从操作系统内核视角看到的线程。
🐷 优点:当一个线程被阻塞时,别的线程还可以继续上执行,并发能力强,多线程可以在多核处理机上并行执行。
🐒 缺点:一个用户进程会占用多个内核级线程,线程切换由OS内核来完成,需要切换到核心态,因此线程管理的成本高、开销大。
5.多线程模型
⭐️ 一对一模型:一个用户及线程映射到一个内核级线程,每个用户进程有于用户级线程同数量的内核级线程。
🐷 优点:当一个线程被阻塞时,别的线程还可以继续上执行,并发能力强,多线程可以在多核处理机上并行执行。
🐒 缺点:一个用户进程会占用多个内核级线程,线程切换由OS内核来完成,需要切换到核心态,因此线程管理的成本高、开销大。
⭐️ 多对一模型:多个用户及线程映射到一个内核级线程,每个用户进程有于用户级线程同数量的内核级线程。
🌭 优点:线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。
🍔 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高,多个线程不可在多喝处理机上并发运行。
👿 重点:操作系统只负责管理内核级线程,因此只有内核级线程才是处理机调度的基本单位。
⭐️ 多对多模型:多个用户及线程映射到多个内核级线程,每个用户进程有于用户级线程同数量的内核级线程。
🌭 优点:克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用了太多的内核级现场,开销太大的缺点。一对一(浪费太多资源),多对一(无法实现并发)。多对多既能实现并发,又节省资源。
🍱 划重点
用户级线程是”代码逻辑“的载体
内核级线程是”运行机会“的载体
一段”代码逻辑“只有获得了”运行机会“才能被CPU执行。内核级线程中可以运行一个有映像关系的用户级线程代码,只有一个进程的全部内核级线程中正在运行的代码逻辑都阻塞时,这个线程才会阻塞。
总结