c语言多线程间共享哪些数据

李小白20200202

于 2023-06-06 10:13:54 发布

阅读量543

点赞数

文章标签： c语言 java 开发语言

本文链接：https://blog.csdn.net/l00102795/article/details/131043512

版权

问题描述

一个进程中的多个线程调用了共享库中的函数，共享库中定义了静态变量，该静态变量共享吗？

首先我们需要明确三个问题：

一个进程加载了共享库后，共享库的代码放在哪里？
一个进程的多线程之间会共享哪些数据？
静态局部变量是放在哪个区域？

首先我们来看下进程地址空间中的数据排放顺序：

动态库代码放在哪里？

动态库在被系统加载后，代码段只有一份，所有使用者（即所有的应用进程）共享。对于数据段要分两种情况：

如果是多进程的话，数据段在每个进程中拥有一个独立的副本，所以数据是安全的；
如果是多线程的话，数据段在同一个进程中是同一个地址空间，所以数据是不安全的；

线程间共享哪些数据？

线程私有资源

线程运行的本质其实就是函数的执行，函数的执行总会有一个源头，这个源头就是所谓的入口函数，CPU从入口函数开始执行从而形成一个执行流，只不过我们人为的给执行流起一个名字，这个名字就叫线程。

既然线程运行的本质就是函数的执行，那么函数执行都有哪些信息呢？在《[函数运行时在内存中是什么样子]》这篇文章中应该提过，函数运行时的信息保存在栈帧中，栈帧中保存了函数的返回值、调用其它函数的参数、该函数使用的局部变量以及该函数使用的寄存器信。

如图所示，假设函数A调用函数B：

CPU执行指令的信息保存在一个叫做程序计数器的寄存器中，通过这个寄存器我们就知道接下来要执行哪一条指令。由于操作系统随时可以暂停线程的运行，因此我们保存以及恢复程序计数器中的值就能知道线程是从哪里暂停的以及该从哪里继续运行了。由于线程运行的本质就是函数运行，函数运行时信息是保存在栈帧中的，因此每个线程都有自己独立的、私有的栈区。

同时函数运行时需要额外的寄存器来保存一些信息，像部分局部变量之类，这些寄存器也是线程私有的，一个线程不可能访问到另一个线程的这类寄存器信息。

从上面的讨论中我们知道，到目前为止，所属线程的栈区、程序计数器、栈指针以及函数运行使用的寄存器是线程私有的。

以上这些信息有一个统一的名字，就是线程上下文，thread context。我们也说过操作系统调度线程需要随时中断线程的运行并且需要线程被暂停后可以继续运行，操作系统之所以能实现这一点，依靠的就是线程上下文信息。

代码区

进程地址空间中的代码区，这里保存的是什么呢？从名字中有的同学可能已经猜到了，没错，这里保存的就是我们写的代码，更准确的是编译后的可执行机器指令。

那么这些机器指令又是从哪里来的呢？答案是从可执行文件中加载到内存的，可执行程序中的代码区就是用来初始化进程地址空间中的代码区的。

线程之间共享代码区，这就意味着程序中的任何一个函数都可以放到线程中去执行，不存在某个函数只能被特定线程执行的情况。

数据区

进程地址空间中的数据区，这里存放的就是所谓的全局变量。什么是全局变量？所谓全局变量就是那些你定义在函数之外的变量，在C语言中就像这样：

其中字符c就是全局变量，存放在进程地址空间中的数据区。

在程序员运行期间，也就是run time，数据区中的全局变量有且仅有一个实例，所有的线程都可以访问到该全局变量。值得注意的是，在C语言中还有一类特殊的“全局变量”，那就是用static关键词修饰过的变量，就像这样：

注意到，虽然变量a定义在函数内部，但变量a依然具有全局变量的特性，也就是说变量a放在了进程地址空间的数据区域，即使函数执行完后该变量依然存在，而普通的局部变量随着函数调用结束和函数栈帧一起被回收掉了，但这里的变量a不会被回收，因为其被放到了数据区。
这样的变量对每个线程来说也是可见的，也就是说每个线程都可以访问到该变量。

堆区是程序员比较熟悉的，我们在C/C++中用malloc或者new出来的数据就存放在这个区域，很显然，只要知道变量的地址，也就是指针，任何一个线程都可以访问指针指向的数据，因此堆区也是线程共享的属于进程的资源。（因为线程间共享地址空间，所以无论哪个线程访问这个地址都是指向同一块内存空间）