【Linux】线程的概念

我爱小白羊

已于 2024-07-26 20:05:28 修改

阅读量899

点赞数 21

文章标签： linux 运维服务器

于 2024-07-26 19:40:26 首次发布

本文链接：https://blog.csdn.net/weixin_42976474/article/details/140708540

版权

前言：
本节我们将进入Linux系统编程中多线程的学习，了解线程概念，理解线程与进程区别与联系…

1.线程概念

在之前的Linux学习中，学习了进程的相关概念，操作系统内核中的task_struct描述进程，CPU在运行时，会根据时间片轮询调度进程，让每个进程得以推进。

每个进程的PCB结构都可以看待一整个进程地址空间，以前学的进程是一个PCB对应一个进程地址空间。
线程可以理解为轻量级进程，每一个进程都可以创建多个限制，并执行不同的代码。

在这里插入图片描述

线程在进程内部执行，是OS调度的基本单位。。（在进程的地址空间内运行）

线程的区别点
1.不再分配独立的地址空间。
2.不再分配独立的页表，而是所有PCB指向同一地址空间，甚至将来访问同一张页表。
3.CPU看待进程和线程是一样的，调度的时候，都是以task_struct为单位来调度的。

1.1 Linux系统和Windows系统上线程实现的区别：

Windows系统中：

是真线程的操作系统， 分Pcb (Process Control Block) 和tcb (Thread Control Block)
在真正的线程操作系统中，TCB (Thread Control Block)和PCB(Process Control Block)是分开实现的。

Linux系统中：

是用进程模拟的Pcb来模拟的，linux系统中设计了单独的线程lib库（Pthread) ，来进行线程的操作
Linux没有提供，纯创建线程的系统调用接口。因为底层没有用真线程，用的是Lib库来模拟操作的。
进程和线程在概念上没有区分，用的都是task_struct。

为什么线程切换成本比较低？
（1）虚拟地址空间不需要切换（2）页表不需要切换

1.2 线程的优缺点：

线程的优点
创建一个新线程的代价要比创建一个新进程小的多。
与进程的切换相比，**线程之间的切换需要操作系统做的工作要少的多。
线程占用的资源要比进程少很多
能充分利用多处理器的可并行数量
在等待慢速I/O操作结束的同时，程序可执行其他的计算任务
计算密集型应用，为了能在多处理器系统上运行，将计算分解到多个线程中实现
I/O密集型应用，为了提高性能，将I/O操作重叠。线程可以同时等待不同的I/O操作
线程的缺点

性能损失。
如果计算密集型线程的数量比可用的处理器多，那么可能会有较大的性能损失，这里的性能损失指的是增加了额外的
同步和调度开销，而可用的资源不变。
2. 健壮性降低
编写多线程需要更全面更深入的考虑，在一个多线程程序里，因时间分配上的细微偏差或者因共享了
不该共享的变量而造成不良影响的可能性是很大的，换句话说线程之间是缺乏保护的
3. 缺乏访问控制
如果多线程都去调用某些OS函数，会对整个进程造成影响。
4.编程难度提高
编写与调试一个多线程程序比单线程程序困难得多

1.3 线程异常：

单个线程如果出现除零，野指针问题导致线程崩溃，进程也会随着崩溃
线程是进程的执行分支，线程出异常，就类似进程出异常，进而触发信号机制，终止进程，进程终止，该
进程内的所有线程也就随即退出

线程用途

合理的使用多线程，能提高CPU密集型程序的执行效率
合理的使用多线程，能提高IO密集型程序的用户体验（如生活中我们一边写代码一边下载开发工具，就是多线程运行的一种表现）

1.4 Linux进程与线程的区别：

进程是资源分配的基本单位
线程是调度的基本单位
线程共享进程数据，但也拥有自己的一部分数据（独享的）:

线程ID
一组寄存器
栈
errno
信号屏蔽字
调度优先级

线程共享进程的地址空间，因此文本段、数据段都是共享的。
如果定义一个函数，在各线程中都可以调用。。
如果定义一个全局变量，在各线程都可以访问到。。

文件描述符表
每种信号的处理方式(SIG_ IGN、SIG_ DFL或者自定义的信号处理函数)
当前工作目录
用户id和组id

2. 线程的函数

POSIX线程库

与线程有关的函数构成了一个完整的系列，绝大多数函数的名字都是以“pthread_”打头的
使用时，要通过引入头文<pthread.h>
链接时，这些线程函数库时要使用编译器命令的“-lpthread”选项

2.1 线程的创建

Linux中没有原生创建线程的接口，应用级程序员帮我们开发出了一批接口，叫做pthread_create。叫做原生线程库

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *
(*start_routine)(void*), void *arg);
参数
thread:返回线程ID
attr:设置线程的属性，attr为NULL表示使用默认属性
start_routine:是个函数地址，线程启动后要执行的函数
arg:传给线程启动函数的参数，它是一个void类型的指针，可以传递任意类型的数据给线程函数。。。
返回值：成功返回0；失败返回错误码

注意：

在现在所有主流的Linux版本中，都默认带这个库，是原生的，在操作系统中就存在的。
不是所谓的系统调用接口，是库函数。
传统的一些函数是，成功返回0，失败返回-1，并且对全局变量errno赋值以指示错误。
pthreads函数出错时不会设置全局变量errno（而大部分其他POSIX函数会这样做）。而是将错误代码通
过返回值返回

补充知识点：

pthread_ create函数会产生一个线程ID【pthread_t 】，存放在第一个参数指向的地址中。该线程ID和前面说的线程ID不是一回事
前面讲的线程ID属于进程调度的范畴。因为线程是轻量级进程，是操作系统调度器的最小单位，所以需要一个数值来唯一表示该线程
线程库NPTL提供了pthread_ self函数，可以获得线程自身的ID.
pthread_ create函数第一个参数指向一个虚拟内存单元，该内存单元的地址即为新创建线程的线程ID，
属于NPTL线程库的范畴。线程库的后续操作，就是根据该线程ID来操作线程的

2.2 pthread_t 线程ID的介绍

pthread_t pthread_self(void);
%可用于获取线程库对应的线程ID

pthread_t 到底是什么类型呢？

pthread_t类型的线程ID，本质就是一个进程地址空间上的一个地址

2.3 线程的终止

如果需要只终止某个线程，而不终止整个进程，有以下三种方法：

1.从线程函数Return .这种方法对主线程不适用（因为从main函数return，相当于调用了exit,整个进程都退出了)
2.线程可以调用pthread_ exit终止自己
3.一个线程可以调用pthread_ cancel，终止同一进程中的另一个线程。

void pthread_exit(void *value_ptr);
参数
value_ptr:value_ptr不要指向一个局部变量。
返回值：无返回值，跟进程一样，线程结束的时候无法返回到它的调用者（自身）

需要注意,pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的,不能在线程函
数的栈上分配,因为当其它线程得到这个返回指针时线程函数已经退出了

pthread_cancel函数：

功能：取消一个执行中的线程
原型
int pthread_cancel(pthread_t thread);
参数
thread:线程ID
返回值：成功返回0；失败返回错误码

2.4 线程等待

为什么需要线程等待？

已经退出的线程，其空间没有被释放，仍然在进程的地址空间内。
创建新的线程不会复用刚才退出线程的地址空间

线程退出的时候，一般必须要进行join，如果不进行join：

就会造成类似于进程那样的内存泄漏的问题（没有僵尸线程这样的说法）
线程对应的退出结果暂时不获取

int pthread_join(pthread_t thread, void **value_ptr);
参数
thread:线程ID
value_ptr:它指向一个指针，后者指向线程的返回值，是输出型参数
返回值：成功返回0；失败返回错误码

调用该函数的线程将挂起等待,直到id为thread的线程终止。thread线程以不同的方法终止,通过pthread_join得到的
终止状态是不同的.

如果thread线程通过return返回,value_ ptr所指向的单元里存放的是thread线程函数的返回值。
如果thread线程被别的线程调用pthread_ cancel异常终掉,value_ ptr所指向的单元里存放的是常数 PTHREAD_ CANCELED。
如果thread线程是自己调用pthread_exit终止的,value_ptr所指向的单元存放的是传给pthread_exit的参数。
如果对thread线程的终止状态不感兴趣,可以传NULL给value_ ptr参数

2.5 分离线程

默认情况下，新创建的线程是joinable的，线程退出后，需要对其进行pthread_join操作，否则无法释放资源，从而造成系统泄漏。
如果不关心线程的返回值，join是一种负担，这个时候，我们可以告诉系统，当线程退出时，自动释放线程资源.

 int pthread_detach(pthread_t thread);

可以是线程组内其他线程对目标线程进行分离，也可以是线程自己分离。

pthread_detach(pthread_self());

注意：joinable和分离是冲突的，一个线程不能既是joinable又是分离的

3 查看线程

代码演示：

#include <iostream>
#include <string>
#include <unistd.h>
// #include <pthread.h>
#include <thread> // C++11的线程库
using namespace std;
void* callback1(void* args)
{
    string name = (char*)args;
    while (true)
    {
        cout << name << ": " << ::getpid() << endl;
        sleep(1);
    }
}
void* callback2(void* args)
{
    string name = (char*)args;
    while (true)
    {
        cout << name << ": " << ::getpid() << endl;
        sleep(1);
    }
}

int main()
{
    // std::thread t([](){
    //     while(true)
    //     {
    //         cout << "线程运行起来啦" << endl;
    //         sleep(1);
    //     }
    // });

    // 等待就可以了
    // t.join();

    pthread_t tid1;
    pthread_t tid2;
    pthread_create(&tid1, nullptr, callback1, (void*)"thread 1");
    pthread_create(&tid2, nullptr, callback2, (void*)"thread 2");

    while (true)
    {
        cout << "我是主线程...: " << ::getpid() << endl;
        sleep(1);
    }
    pthread_join(tid1, nullptr);
    pthread_join(tid2, nullptr);

    return 0;
}