进程和线程

懂事的小样儿

已于 2022-06-21 13:41:58 修改

阅读量121

点赞数

文章标签： java linux 开发语言

于 2022-06-21 13:16:43 首次发布

原文链接：https://baijiahao.baidu.com/s?id=1687308494061329777&wfr=spider&for=pc

版权

https://baijiahao.baidu.com/s?id=1687308494061329777&wfr=spider&for=pc

进程和线程这两个话题是程序员绕不开的，操作系统提供的这两个抽象概念实在是太重要了。（对于一个进程中的多个线程，如果一个线程挂掉将导致整个进程挂掉！）

关于进程和线程有一个极其经典的问题，那就是进程和线程的区别是什么？

关于这个问题，有的同学可能已经背得滚瓜烂熟了：“进程是操作系统分配资源的单位，线程是调度的基本单位，线程之间共享进程资源”。

可是你真的理解了上面最后一句话吗？到底线程之间共享了哪些进程资源，共享资源意味着什么？共享资源这种机制是如何实现的？

如果你没有答案的话，这篇文章就是为你准备的。

逆向思考

查理芒格经常说这样一句话：“反过来想，总是反过来想”。

如果你对线程之间共享了哪些进程资源这个问题想不清楚的话，不妨反过来思考，有哪些资源是线程私有的。

线程私有资源

线程运行的本质其实就是函数的执行。函数的执行总会有一个源头，这个源头就是所谓的入口函数，CPU 从入口函数开始执行从而形成一个执行流，只不过我们人为的给执行流起一个名字，这个名字就叫线程。

既然线程运行的本质就是函数的执行，那么函数执行都有哪些信息呢？

函数运行时的信息保存在栈帧中，栈帧中保存了函数的返回值、调用其它函数的参数、该函数使用的局部变量以及该函数使用的寄存器信息，如图所示，假设函数 A 调用函数 B：

此外，CPU 执行指令的信息保存在一个叫做程序计数器的寄存器中，通过这个寄存器我们就知道接下来要执行哪一条指令。由于操作系统随时可以暂停线程的运行，因此我们保存以及恢复程序计数器中的值就能知道线程是从哪里暂停的以及该从哪里继续运行了。

由于线程运行的本质就是函数运行，函数运行时信息是保存在栈帧中的，因此每个线程都有自己独立的、私有的栈区。
在这里插入图片描述

同时函数运行时需要额外的寄存器来保存一些信息，像部分局部变量之类。这些寄存器也是线程私有的，一个线程不可能访问到另一个线程的这类寄存器信息。

从上面的讨论中我们知道，到目前为止，所属线程的栈区、程序计数器、栈指针以及函数运行使用的寄存器是线程私有的。

以上这些信息有一个统一的名字，就是线程上下文，thread context。

我们也说过操作系统调度线程需要随时中断线程的运行并且需要线程被暂停后可以继续运行，操作系统之所以能实现这一点，依靠的就是线程上下文信息。

现在你应该知道哪些是线程私有的了吧。

除此之外，剩下的都是线程间共享资源。

那么剩下的还有什么呢？还有图中的这些。
在这里插入图片描述

这其实就是进程地址空间的样子，也就是说线程共享进程地址空间中除线程上下文信息中的所有内容，意思就是说线程可以直接读取这些内容。

接下来我们分别来看一下这些区域。

代码区

进程地址空间中的代码区，这里保存的是什么呢？从名字中有的同学可能已经猜到了，没错，这里保存的就是我们写的代码，更准确的是编译后的可执行机器指令。

那么这些机器指令又是从哪里来的呢？答案是从可执行文件中加载到内存的，可执行程序中的代码区就是用来初始化进程地址空间中的代码区的。

线程之间共享代码区，这就意味着程序中的任何一个函数都可以放到线程中去执行，不存在某个函数只能被特定线程执行的情况。

数据区

进程地址空间中的数据区，这里存放的就是所谓的全局变量。

什么是全局变量？所谓全局变量就是那些你定义在函数之外的变量，在 C 语言中就像这样：

char c; // 全局变量void func() {}

其中字符 c 就是全局变量，存放在进程地址空间中的数据区。
在这里插入图片描述

在程序员运行期间，也就是 run time，数据区中的全局变量有且仅有一个实例，所有的线程都可以访问到该全局变量。

值得注意的是，在 C 语言中还有一类特殊的“全局变量”，那就是用 static 关键词修饰过的变量，就像这样：

voidfunc(){staticint a = 10;}

注意到，虽然变量 a 定义在函数内部，但变量 a 依然具有全局变量的特性，也就是说变量 a 放在了进程地址空间的数据区域，即使函数执行完后该变量依然存在，而普通的局部变量随着函数调用结束和函数栈帧一起被回收掉了，但这里的变量 a 不会被回收，因为其被放到了数据区。

这样的变量对每个线程来说也是可见的，也就是说每个线程都可以访问到该变量。

堆区

堆区是程序员比较熟悉的，我们在 C/C++中用 malloc 或者 new 出来的数据就存放在这个区域，很显然，只要知道变量的地址，也就是指针，任何一个线程都可以访问指针指向的数据，因此堆区也是线程共享的属于进程的资源。
在这里插入图片描述

栈区

唉，等等！刚不是说栈区是线程私有资源吗，怎么这会儿又说起栈区了？

确实，从线程这个抽象的概念上来说，栈区是线程私有的，然而从实际的实现上看，栈区属于线程私有这一规则并没有严格遵守，这句话是什么意思？

通常来说栈区是线程私有，既然有通常就有不通常的时候。

不通常是因为不像进程地址空间之间的严格隔离，线程的栈区没有严格的隔离机制来保护，因此如果一个线程能拿到来自另一个线程栈帧上的指针，那么该线程就可以改变另一个线程的栈区，也就是说这些线程可以任意修改本属于另一个线程栈区中的变量。
在这里插入图片描述

这从某种程度上给了程序员极大的便利，但同时，这也会导致极其难以排查到的 bug。

试想一下你的程序运行的好好的，结果某个时刻突然出问题，定位到出问题代码行后根本就排查不到原因，你当然是排查不到问题原因的，因为你的程序本来就没有任何问题，是别人的问题导致你的函数栈帧数据被写坏从而产生 bug，这样的问题通常很难排查到原因，需要对整体的项目代码非常熟悉，常用的一些 debug 工具这时可能已经没有多大作用了。

说了这么多，那么同学可能会问，一个线程是怎样修改本属于其它线程的数据呢？

接下来我们用一个代码示例讲解一下。

修改线程私有数据

不要担心，以下代码足够简单：

voidthread(void* var) {int* p = (int*)var; p = 2;}intmain() {int a = 1; pthread_t tid; pthread_create(&tid, NULL, thread, (void)&a);return0;}

这段代码是什么意思呢？

首先我们在主线程的栈区定义了一个局部变量，也就是 int a= 1这行代码，现在我们已经知道了，局部变量 a 属于主线程私有数据，但是，接下来我们创建了另外一个线程。

在新创建的这个线程中，我们将变量 a 的地址以参数的形式传给了新创建的线程，然后我来看一下 thread 函数。

在新创建的线程中，我们获取到了变量 a 的指针，然后将其修改为了 2，也就是这行代码，我们在新创建的线程中修改了本属于主线程的私有数据。

现在你应该看明白了吧，尽管栈区是线程的私有数据，但由于栈区没有添加任何保护机制，一个线程的栈区对其它线程是可以见的，也就是说我们可以修改属于任何一个线程的栈区。

就像我们上文说到的，这给程序员带来了极大便利的同时也带来了无尽的麻烦，试想上面这段代码，如果确实是项目需要那么这样写代码无可厚非，但如果上述新创建线程是因 bug 修改了属于其它线程的私有数据的话，那么产生问题就很难定位了，因为 bug 可能距离问题暴露的这行代码已经很远了，这样的问题通常难以排查。

动态链接库

进程地址空间中除了以上讨论的这些实际上还有其它内容，还有什么呢？

这就要从可执行程序说起了。

什么是可执行程序呢？在 Windows 中就是我们熟悉的 exe 文件，在 Linux 世界中就是 ELF 文件，这些可以被操作系统直接运行的程序就是我们所说的可执行程序。

那么可执行程序是怎么来的呢？

有的同学可能会说，废话，不就是编译器生成的吗？

实际上这个答案只答对了一半。

假设我们的项目比较简单只有几个源码文件，编译器是怎么把这几个源代码文件转换为最终的一个可执行程序呢？

原来，编译器在将可执行程序翻译成机器指令后，接下来还有一个重要的步骤，这就是链接，链接完成后生成的才是可执行程序。

完成链接这一过程的就是链接器。
在这里插入图片描述