Linux线程概念

最新推荐文章于 2024-07-17 14:55:21 发布

聪明的骑士

最新推荐文章于 2024-07-17 14:55:21 发布

阅读量516

点赞数 3

分类专栏： Linux 文章标签： linux 运维服务器

本文链接：https://blog.csdn.net/qq_65285898/article/details/132569115

版权

Linux 专栏收录该内容

36 篇文章 7 订阅

订阅专栏

一、页表详解

我们虽然已经知道了页表可以储存虚拟地址和物理地址的映射，而且转换物理空间的过程是页表和MMU共同完成的，但是我们还是很难具象性地理解这个数据结构。看完下面这部分就相信我们对它的理解就更具体直观了。

1.地址的属性

#include<iostream>
using namespace syd;
int main()
{
    char* str = "hello world";
    *str = 'H';
    return 0;
}

这段代码运行会报错，因为str指向的虚拟地址在字符常量区，字符常量区的数据不允许用户修改。

操作系统能知道一个地址可否被读写的原因是：页表中储存了各个地址的属性。

那我们不妨画一个页表的示意图。

可以看到每个虚拟地址都有自己的属性，而虚拟地址、物理地址及其属性组成的那一行数据就称为条目。

U/K权限：U表示用户(user)，K表示内核(kernal)。
RWX权限：当前身份(用户或者内核)对当前地址的读，写执行权限。

代码在对str的地址进行写操作时，会先经过页表寻找物理地址。但是页表发现这是一个写操作且该地址不允许修改，此时MMU就发送信号，程序报错。

2.页框

32位系统的物理内存理论上有4GB，这4GB又被分成了许多大小为4KB的小空间，被叫做页框。

这些页框当然需要操作系统的管理，采用的方式同样为先描述，后组织。

我们可以用一个结构体struct_Page管理一个页框。

struct_Page
{
    //4KB空间的属性
}

如果我们再将多个结构体对象放在一个数组中：struct_Page mem[];

此时所有的页框就被管理起来了，操作系统会用一个叫做伙伴系统的调度算法管理这些数组。如果对这个算法有兴趣，可以自行查阅资料了解，不再赘述。

3.页表录和页表项

既然页表能够覆盖4GB的地址空间，那么它就会应该有2的32次方个条目，每个条目包含了物理地址、虚拟地址和其他属性。

那我们假设一个条目的大小是10Bytes，光一个页表就应该占10×2^32=40GB的空间，早就远远超过了系统物理内存，所以页表的设计一定不是这样的。

实际上，页表是由页目录和页表项组成的。那么通过一个32比特位的虚拟地址又是怎么找到一个物理地址的呢？

由于一个地址总共32个比特位，我们不妨把它分为三个部分，前面的10个比特位，中间10个比特位，结尾12个比特位。

其中前10位是页目录的下标，对应红框的十个0，通过这个下标0就可以访问到页目录中的第一个条目。由于页目录中储存着页表项的地址，通过下标就能找到对应的页表项。

10个比特位意味着页目录的下标范围是0~1023，也就是页目录最多有1024个条目。

32个比特位的中间10位是页表项的下标，同样可以访问页表项中的条目。由于页表项中储存着物理内存的页框起始地址，这样就可以通过下标找到物理内存的对应页框。

同样，一个页表项最多也有1024个条目，指向1024个页框。

32个比特位中的最后12位，作为偏移量，在页框的起始地址加上偏移量就可以找到具体数据在内存中的地址。

这也是为什么页框和页帧的大小设置为4KB的原因，因为以一个字节为单元，最低的12个比特位偏移量最多能覆盖4KB的空间。

那我们不妨再次总结一下整个映射过程：

首先，高10位做下标，从页目录中找到对应页表项的地址；

然后，中间10位做下标，从页表项中找到对应页框的起始物理地址；

最后，低12位做偏移量，在起始物理地址上加上偏移量找到具体的物理地址。

当然，页目录和页表项同样采用先描述再组织的方式进行管理。每创建一个进程就会有一个页目录被创建，只有建立映射的虚拟地址才会建立页表项进行管理。采用这种方式，大大减少了对内存的消耗。

地址空间是进程看到的资源，每个进程都认为4GB的资源都被自己占有。而页表映射物理地址的能力决定了进程真正拥有的资源。合理对地址空间和页表进行资源划分，就可以对一个进程所有的资源进行分类。

二、认识线程

1.线程的概念

线程是进程内部的一个执行流。

这个概念貌似抽象，但我举个例子就好理解了。比如说，一个三口之家，爸爸在公司上班，妈妈在家打扫卫生，孩子在学校上学。虽然三个人各自干着不同的事，但它们依然在家庭这个屋檐下。

在这个例子中三个人都在做自己的事情，类比到进程中就是一个进程有三个执行流。而大家都属于同一个家，类比在进程中就是多个执行流会共享进程的资源。到这里，我们把“进程内部的执行流”叫做线程。

其实我们之前学到的进程只有一个执行流，也就是一个进程中只有一个线程。这个最初的进程执行流叫做主线程，之后创建的执行流都叫做新线程，主线程与新线程同属一个进程。

还是上面的例子，家庭成员共享家庭资源，家庭成员之间既可以有共享资源，也可以有私人秘密。

同样，所有的线程都共用一个地址空间，所以线程间可能会互相影响。

在一个程序里的一个执行路线就叫做线程（thread）。更准确地说，线程是“一个进程内部的控制序列”
一切进程至少都有一个执行线程
线程在进程内部运行，本质是在进程地址空间内运行
在Linux系统中，在CPU眼中，看到的PCB都要比传统的进程更加轻量化
透过进程虚拟地址空间，可以看到进程的大部分资源，将进程资源合理分配给每个执行流，就形成了线程执行流
线程共享进程数据，但也拥有自己的一部分数据，比如线程ID、一组寄存器、栈结构、errno、信号屏蔽字与调度优先级

2.轻量级进程

在操作系统中有着这么多的线程，操作系统就必须对其进行管理。

根据先描述，再组织的原则，首先我们要为线程设计专门描述其属性的数据结构——线程控制块（TCB），在设置好TCB后，再用一些链表这样的数据结构对TCB进行管理，还需要编写管理TCB的管理算法，这样就能做到对线程的管理了。

在开发者们设计Linux时，它们发现线程和进程在属性上非常相似，而且管理算法也基本一致，所以他们就以作为PCB的task_struct结构体直接用到了线程TCB上，管理PCB的算法也能直接用于管理TCB。

当同时有进程和线程运行时，由于进程PCB和线程TCB底层都是task_struct结构体，所以CPU也不能识别哪个是进程，哪个是线程，就统一当进程处理了。所以在Linux中的进程和线程就统一叫做轻量级进程，也就是说在Linux中是不存在线程的概念的。

三、线程的简单控制

1.线程的创建

int pthread_create(pthread_t* thread, const pthread_attr_t *attr, void*(*start_routine)(void*), void* arg);

头文件：pthread.h

功能：创建一个线程。

参数：pthread_t* thread是线程标识符指针，pthread_t是线程标识符的类型，它是一个输出型参数。const pthread_attr_t* attr是线程属性，现在设成nullptr就好。void* (*start_routine)(void )：是一个函数指针，线程会执行该函数中的代码。void* arg是线程执行函数的形参。

返回值：成功返回0，失败返回的错误码。

#include<iostream>
#include<pthread.h>
#include<assert.h>
#include<unistd.h>
using namespace std;

void* start_routine(void* args)
{
    char* arg = (char*)args;
    while(1)
    {
        cout  << arg << ":我是一个新线程"<<endl;
        sleep(1);
    }
}

int main()
{
    pthread_t tid;
    int n = pthread_create(&tid, nullptr, start_routine, (void*)"new pthread");
    assert(n == 0);
    while(1)
    {
        cout << "我是主线程" << endl;
        sleep(1);
    }
    return 0;
}

我们直接编译，但是它告诉我们pthread_create编译器不认识。

这是因为在Linux内核中不存在线程概念，更没有TCB数据结构及其管理算法，而我们所说的线程，都是在宏观层面面对所有操作系统。

Linux操作系统中当然也没有提供创建线程的系统调用，它只能提供创建轻量级进程的系统调用。

但是大部分程序员都已经习惯了创建线程，那该怎么办呢？

所以我们需要在创建线程时调用一个线程库，库中会通过一些系统调用创建轻量级进程。在用户层程序员创建线程，Linux内核中创建轻量级进程，双方的要求都能满足。

因为这个线程库是所有Linux操作系统必须自带的，所以也叫做原生线程库。

我们在编译指令后加上 -lpthread链接原生线程库，程序就正常运行了。new pthread作为参数也被传递到新线程函数中。

输入ldd加可执行程序可以看到它的链接属性。

可以看到原生线程库时动态链接的，我们再看看这个被链接的库的位置。

我们发现被链接的这个文件其实是原生线程库libpthread-2.17.so的软连接。

2.PID和LWP

我们再次运行上面的程序，输入ps ajx | grep ...的指令进行进程查看。

和我们的讲解一致，虽然现在有两个线程在运行，但我们只能找到一个进程，pid为2874（下面那个是grep指令的进程）

输入ps -aL（L必须大写）查看线程

此时可以看到sp有两个线程，它们的PID值都为2874，但LWP值为2874和2875。

其中PID是进程标识符，LWP（Light Weight Process）是轻量级进程标识符。由于第一个线程的LWP和PID是一样的，所以这个线程就被叫做主线程。而第二个线程LWP和PID不一样，这个线程叫做新线程，PID和LWP的异同才是判断线程是否为主线程的标志。

我们说过，CPU在调度task_struct时将它们一律看作进程，不同进程的PID一定不同，而同进程的线程PID是相同的，所以只有LWP才能作为标识符标识执行流的唯一性。

因为CPU每次只能处理一个执行流，而进程可以存在一个或多个执行流。CPU通过LWP识别执行流，这个执行流放在操作系统就是线程，所以线程是CPU调度的基本单位。

而对于之前学过的进程而言，由于它只有一个执行流，LWP和PID一致，所以我们就不会提及LWP。

既然说到了进程，在Linux下进程才有独立的页表和地址空间，所以进程是资源分配的基本单位。

结论：LWP是轻量级进程标识符，也相当于线程的标识符，PID与LWP的异同决定改线程是否为主线程。进程是资源分配的基本单位，线程是CPU调度的基本单位。

3.线程异常

单个线程如果出现除零，野指针等问题导致线程崩溃，而线程是进程的一部分，进程也会出异常，进而触发信号机制，终止进程，进程终止，该进程内的所有线程也就随即退出。相当于只要有一个人出错了，整个团队的工作就都停止了。这也是我们向进程发送2号信号可以终止所有线程的原因。

如果程序容易出现这样的问题，我们称这个程序健壮性或者鲁棒性较差。

下面的代码就能实现上述结果：

#include<iostream>
#include<pthread.h>
#include<assert.h>
#include<unistd.h>
using namespace std;

void* start_routine(void* args)
{
    sleep(3);
    int* p = nullptr;
    *p = 1;
}

int main()
{
    pthread_t tid;
    int n = pthread_create(&tid, nullptr, start_routine, (void*)"new pthread");
    assert(n == 0);
    while(1)
    {
        cout << "我是主线程" << endl;
        sleep(1);
    }
    return 0;
}

4.线程的资源

（1）共享的资源

所有线程都共享一个虚拟地址空间，一个页表，而且进程中的绝大部分资源线程都共享。

我们创建一个全局变量，而且让主线程也运行线程函数。

#include<iostream>
#include<pthread.h>
#include<assert.h>
#include<unistd.h>
using namespace std;
int gal_num = 0;

void* start_routine(void* args)
{
    char* arg = (char*)args;
    while(1)
    {
        cout  << arg << ":我是一个线程" << ++gal_num << endl;
        sleep(1);
    }
}

int main()
{
    pthread_t tid;
    int n = pthread_create(&tid, nullptr, start_routine, (void*)"pthread2");
    assert(n == 0);
    start_routine((void*)"pthread1");
    return 0;
}

我们发现两个线程都可以使用同一个函数，说明代码区共享，说明进程的多个线程共享进程地址空间，两个线程可以改变同一个变量，又说明它们共享页表。

（2）独有的资源

线程也有自己独有的资源。比如，描述它们的task_struct结构体私有，线程运行的上下文数据私有，栈结构独立私有，可以在线程内部创建临时变量。

虽然我们可理解栈结构私有的意义，但是所有线程都用同一块虚拟地址空间的栈区，又怎么能产生独立栈结构呢？

这是因为，原生线程库的pthread_creat使用了系统调用clone，而clone是可以创建子进程的。这里创建的子进程是轻量级进程，没有独立的虚拟地址空间。

我们查看clone的声明：int clone(int (*fn)(void *), void *stack, int flags, void arg, .../ pid_t *parent_tid, void *tls, pid_t *child_tid */ );

clone中有一个参数void* stack，这个参数就是用来设置这个子进程栈空间的。

5.线程的特点

线程的优点：

创建一个新线程不需要独立的地址空间和页表，代价要比创建一个新进程小得多。

那这个代价小了多少呢？

进程切换的工作包括：PCB切换、上下文数据切换、转变虚拟地址空间、转换页表

而线程切换仅包括：PCB切换和上下文数据切换

这里还有一个细节：进程切换需要重新加载高速缓存的内容，而线程切换高速缓存（cache）的内容大部分都可以保留。

CPU在使用数据时，会先去高速缓存cache中拿（详见之前的计算机数据存储模式），如果不命中（不存在该数据），cache就会根据局部性原理将CPU需要的数据从内存加载到cache中，尤其使用频率高的热点数据会一直放在cache中。

cache中的内容是根据虚拟地址和页表缓存进来的，所以同一个进程的线程之间这些数据都是可以共用的。免去了加载数据的过程，大大节省了时间，也节省了操作系统的大量工作。

与进程之间的切换相比，线程之间的切换只需要切换PCB和上下文数据，地址空间和页表都不用切换，工作量更少。
线程占用的资源比进程少得多。
能充分利用多处理器的可并行数量。
在等待慢速I/O操作结束的同时，程序可执行其他的计算任务计算密集型应用，为了能在多处理器系统上运行，将计算分解到多个线程中。
实现I/O密集型应用，为了提高性能，将I/O操作重叠。线程可以同时等待不同的I/O操作。

线程的缺点：

性能损失：一个很少被外部事件阻塞的计算密集型线程往往无法与共它线程共享同一个处理器。如果计算密集型线程的数量比可用的处理器多，那么可能会有较大的性能损失，这里的性能损失指的是增加了额外的同步和调度开销，而可用的资源不变。
健壮性降低：编写多线程需要更全面更深入的考虑，在一个多线程程序里，因时间分配上的细微偏差或者因共享了不该共享的变量而造成不良影响的可能性是很大的，换句话说线程之间是缺乏保护的。
缺乏访问控制：进程是访问控制的基本粒度，在一个线程中调用某些OS函数会对整个进程造成影响。
编程难度提高：编写与调试一个多线程程序比单线程程序困难得多。

还有一点要补充：因为所有PCB都共享地址空间，所以线程能够看到进程的所有资源，线程间通信成本低。但地址空间存在大量的临界资源，势必需要使用各种互斥和同步机制保证临界资源的安全。