线程——操作系统

本博客将讲述操作系统中的线程

一.线程的概念

线程是一个基本的CPU执行单位,也是程序执行流的最小单位。

传统进程机制中,进程是资源分配、调度的基本单位

引入线程后,进程是资源分配的基本单位,线程是调度的基本单位

引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文字聊天、传文件)

引入线程后,进程只作为CPU之外的系统资源的分配单元(如打印机、内存地址空间等都是分配给进程的)。

传统的进程间并发,需要切换进程的运行环境,系统开销很大

线程间并发,如果是同一进程内的线程切换,则不需要切换进程环境,系统开销小

引入线程后,并发所带来的系统开销减小

线程是一个基本的CPU执行单位,也是程序执行流的最小单位线程由线程ID、程序计数器、寄存器集合和堆栈组成。线程是进程的一个实体,线程自己不拥有系统资源,只拥有一点在运行中必不可少的资源,但它可以与同属一个进程的其他线程共享该进程所拥有的全部资源。一个线程可以创建和撤销另一个线程,统一进程的多个线程可以并行执行。

线程是计算机程序中的基本执行单元,它能够在进程内执行任务。与进程不同,线程本身并不拥有系统资源,例如内存空间、文件句柄等。相反,它只拥有一些在运行时必不可少的资源,这些资源通常包括程序计数器、堆栈和一些寄存器等。

引入线程后,进程依然是资源分配的单位。内核级线程时处理器调度和分派的单位。

线程是计算机程序中的基本执行单元,它包括以下几个主要的组成部分:

1.程序计数器(Program Counter:程序计数器是一个寄存器,用于存储线程当前执行的指令的地址。每当线程执行一条指令时,程序计数器的值会随之更新,指向下一条将要执行的指令。这确保了线程能够按照正确的顺序执行指令。

2.堆栈(Stack:每个线程都有自己的堆栈,用于存储局部变量、函数调用信息和临时数据等。堆栈的结构使得线程能够方便地调用和返回函数,同时也提供了一种机制来处理函数的局部变量。堆栈是线程中存储数据的关键部分,它在函数调用和返回时被动态管理。

3.寄存器(Registers:线程可以访问一组通用寄存器,这些寄存器用于存储临时数据、计算中间结果等。寄存器的使用可以提高线程的执行速度,因为寄存器是CPU内部的存储单元,访问速度非常快。通用寄存器包括累加器、索引寄存器、堆栈指针等,不同的CPU架构可能会有不同的寄存器集合。

4.线程本地存储(Thread-Local Storage,TLS:线程本地存储是一块内存区域,每个线程都有自己的TLS,用于存储线程特定的数据。这些数据对于线程是私有的,其他线程无法直接访问。TLS常常用于存储线程特定的上下文信息或全局变量的副本,以避免线程间的数据冲突。

5.线程控制块(Thread Control BlockTCB:线程控制块是操作系统维护的数据结构,用于存储线程的状态信息和管理线程的调度。TCB包括线程的标识、状态、调度优先级、程序计数器值、堆栈指针等信息。操作系统使用TCB来管理线程的创建、销毁、调度和切换。

6.线程局部存储(Thread-Local Storage,TLS:线程局部存储允许线程存储和访问线程特定的数据,而这些数据对于其他线程是不可见的。这允许线程在共享内存的环境中拥有自己的私有数据,而不会引发数据竞争问题。

这些组成部分共同构成了线程的基本结构和功能,使得线程能够并发执行,共享进程的资源,并实现多任务处理。线程的设计和管理通常由操作系统或编程语言的线程库来实现,以提供多线程编程的抽象和接口。

二.线程的实现方式

1.用户级线程(只有用户能感知到线程的存在)

早期的操作系统,还不支持线程,当时线程还是以线程库的形式实现(早期Linux)

1.用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换)

2.用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。

3.在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。“用户级线程”就是“从用户视角看能看到的线程

4.优缺点

优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小(CPU不需要变态),效率高

缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。

2.内核级线程

操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。

大多数现代操作系统都可以实现(Windows、Linux)

1.内核级线程的管理工作操作系统内核完成。

2.线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。

3.操作系统会为每个内核级线程建立相应的TCB (Thread Control Block,线程控制块),通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程

4.优缺点

优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。

缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

内核级线程是处理机调度的基本单位,而进程只作为分配资源的基本单位,多核CPU情况下,多个线程可以分别分派到不同的核心下并行的执行。不同的线程可以存储不同的代码逻辑,即便其中一个线程阻塞,其他线程还可以工作。

3.组合方式

有些系统使用组合方式的多线程实现。在组合实现方式中,内核支持多个内核级线程的建立、调度和管理,同时允许用户程序建立、调度和管理用户级线程。一些内核级线程对应多个用户级线程,这是用户级线程通过时分多路复用内核级线程实现的。同一进程中的多个线程可以同时在多处理机上并行执行,且在阻塞一个线程时不需要将整个进程阻塞,所以组合方式能结合KLT(用户级下线程)和ULT(内核级线程)的优点,并且克服各自的不足。图2.5(c)展示了这种组合实现方式。

在线程实现方式的介绍中,提到了通过线程库来创建和管理线程。线程库(thread library)是为程序员提供创建和管理线程的API。实现线程库主要的方法有如下两种:

①在用户空间中提供一个没有内核支持的库。这种库的所有代码和数据结构都位于用户空间中。这意味着,调用库内的一个函数只导致用户空间中的一个本地函数的调用。

②实现由操作系统直接支持的内核级的一个库。对于这种情况,库内的代码和数据结构位于内核空间。调用库中的一个API函数通常会导致对内核的系统调用。

三.多线程模型

有些系统同时支持用户线程和内核线程,由于用户级线程和内核线程链接方式的不同,从而形成了三种不同的多线程模型

1.一对一模型

一对一模型:一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。

优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。

缺点:一个用户进程会占用多个内核级线程线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

2.多对一模型:

多对一模型:多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。

优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高

缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行

3.多对多模型

多对多模型: n用户及线程映射到m个内核级线程(n >= m)。每个用户进程对应m个内核级线程。

克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。

可以这么理解:

用户级线程是“代码逻辑”的载体

内核级线程是“运行机会”的载体

内核级线程中可以运行任意一个有映射关系的用级线程代码,只有两个内核级线程中正在运行的代码逻辑都阻塞时,这个进程才会阻塞。

四.线程的状态与转换

与进程一样

五.线程的组织与控制

这个博客如果对你有帮助,给博主一个免费的点赞就是最大的帮助❤
欢迎各位点赞,收藏和关注哦❤
如果有疑问或有不同见解,欢迎在评论区留言❤
后续会继续更新大连理工大学相关课程和有关操作系统的内容
点赞加关注,学习不迷路,好,本次的学习就到这里啦!!!

  • 38
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

头发尚存的猿小二

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值