Linux线程控制

最新推荐文章于 2022-12-24 21:37:24 发布

Gerald Kwok

最新推荐文章于 2022-12-24 21:37:24 发布

阅读量170

点赞数

分类专栏： linux知识点

本文链接：https://blog.csdn.net/weixin_42678507/article/details/90731248

版权

linux知识点专栏收录该内容

22 篇文章 1 订阅

订阅专栏

Linux线程控制

线程控制的相关函数不是系统调用是库函数。

线程控制的函数库是POSIX线程库。

POSIX是一个标准，规定了操作系统需要写哪些接口供程序员来使用。

与线程有关的函数大多数都是以pthread_开头的。

需要使用线程函数库的时候需要引入头文件 <pthread>，并且因为该库是一个动态库，在写编译命令的时候需要在后面加上 -lpthread链接这个库。

创建线程

pthread_create

在这里插入图片描述

首先这个函数有四个参数，我先来说一下每个参数都代表着什么：

thread: 这是一个输出型参数，就是你传进去一个pthread_t tid这个类型的变量，然后它给你返回你创建的这个线程的线程 id。（pthread_t是一个unsigned long类型）
attr: 设置线程的属性，如果你并不关注它的属性，你就设置为 NULL就表示使用默认属性。
start_routine: 这是一个函数指针，就是你创建出来的线程，你希望它干什么，就传一个函数进去。这个比创建进程方便多了，创建进程的话，如果你希望创建出来的进程干别的事情，还需要进行进程程序替换。
arg: 这个就是你上一个函数所需要的参数。

返回值：

如果成功返回0，如果失败返回错误码。

一个简单的进程创建程序

#include <iostream>
#include <pthread.h>
#include <unistd.h>
#include <cstdio>
#include <cstdlib>

void *EntryFunc(void *arg)
{
    (void) arg;

    while (true)
    {
        std::cout << "I am thread 1 !" << std::endl;
        sleep(1);
    }

    return nullptr;
}

int main(void)
{
    // 线程 id
    pthread_t tid;
    int ret;

    if ((ret = pthread_create(&tid, nullptr, EntryFunc, nullptr)) != 0)
    {
        perror("pthread_create");
        exit(EXIT_FAILURE);
    }

    // 走到这里说明线程创建成功
    while (true)
    {
        std::cout << "I am Main thread !" << std::endl;
        sleep(1);
    }

    return 0;
}

在这里插入图片描述

从这个程序我们可以得出几条性质：

进程是抢占式调度的，从打印结果可以看出，并没有什么顺序可言。
可以通过 pstack 进程id 这条命令看到线程调用栈。
从线程调用栈可以看出来，创建线程的系统调用是 clone()。

认识线程ID

线程id有两个！对你没有听错。站在不同角度看，线程id就不一样。

先来看一段代码：

void *EntryFunc(void *arg)
{
    (void)arg;
    *(pthread_t *)arg = pthread_self();

    std::cout << *(pthread_t*)arg << std::endl;
    return nullptr;
}


int main(void)
{
    pthread_t tid;
    pthread_t tid_1;
    pthread_create(&tid, NULL, EntryFunc, &tid_1);
    std::cout << tid << std::endl;

    return 0;
}

在这里插入图片描述

这里我们看到，打印出来的线程id是一个很大的数字，其实他是一个地址。

在这里插入图片描述

虚拟地址空间里，有一段区域叫做共享内存。这个里面就存放着除主线程之外其他线程的一些信息，而我们通过创建线程得到的线程id就是指向它本身信息的地址。

在这里插入图片描述

可是我们通过 ps -eLf | grep Main | grep -v grep命令看到的 LWP线程id是通过系统调度角度，看到的线程id。因为线程也是一个轻量级进程，需要被调度，所以它需要一个唯一标识来让操作系统去调度它。

线程终止

线程有一个非常BUG的地方就是，当某一个线程异常终止了，那么整个进程就异常终止。

如果我们需要让线程正常结束而不影响整个进程的话，有已下三种方式：

从线程函数return，这种方法对主线程不适用（主线程就是哪个包含main函数的线程），从main函数return就相当于调用exit，使整个进程终止。
线程可以调用pthread_exit来终止自己。
一个线程可以通过调用pthread_cancel终止同一进程中的另一个线程。

pthread_exit

在这里插入图片描述

参数：

value_ptr这个参数表示线程结束的返回结果，但是这个参数很少用到，所以我下面会填nullptr。

这个函数就是在线程的入口函数里调用的，是让线程自己终止自己，而不会触发异常或使整个进程退出。

void *EntryFunc(void *arg)
{
    (void) arg;

    std::cout << "I am thread 1 !" << std::endl;

    pthread_exit(nullptr);

    std::cout << "Test pthread_exit ." << std::endl;

    return nullptr;
}

int main(void)
{
    pthread_t tid;
    pthread_create(&tid, nullptr, EntryFunc, nullptr);

    while (true)
    {
        sleep(1);
    }
    return 0;
}

在这里插入图片描述

从现象我们可以看出来，线程的入口函数明明有两个打印的语句，但是只打印了一句话，因为在打印第二句话之前我调用了pthread_exit()函数让线程退出了，并且我的主线程还依然存在没有退出。

pthread_cancel

在这里插入图片描述

参数：

thread是本进程中，想要结束的线程的id。

返回值：

成功返回0，失败返回错误码。

这是一个比较鸡肋的函数，因为它可能会破坏线程的事务性。

事务性：要求具有“原子性”，要么就做完，要么就不做，千万不能半途而废，如果半途而废就可能导致数据被破坏。

我们可以看下面这个代码：

std::vector<int> arr(1000000);

void *EntryFunc(void *arg)
{
    (void) arg;
    
    std::cout << "Assignment Start! " << std::endl;
    for(size_t i = 0; i < arr.size(); i++)
    {
        arr[i] = i;
        sleep(1);
    }
    std::cout << "Assignment Done! " << std::endl;

    return nullptr;
}

int main(void)
{
    pthread_t tid;
    pthread_create(&tid, nullptr, EntryFunc, nullptr);

    sleep(1);
    pthread_cancel(tid);
    while (true)
    {
        sleep(1);
    }
    return 0;
}

在这里插入图片描述

不管等多久，Assignment Done！都不会打印，因为主线程把那个线程终止了，这就导致线程1正在修改数据，可是被终止了，所以这个数据就会出现错误。这就破坏了该线程的事务性。

可是如果我把线程1里面的sleep(1)去掉：

void *EntryFunc(void *arg)
{
    (void) arg;
    
    std::cout << "Assignment Start! " << std::endl;
    for(size_t i = 0; i < arr.size(); i++)
    {
        arr[i] = i;
        // sleep(1);
    }
    std::cout << "Assignment Done! " << std::endl;

    return nullptr;
}

在这里插入图片描述

居然，完整结束了，这到底是为什么呢？

pthread_cancel不会立即结束线程，如果该线程是一个CPU密集型的线程，OS会等到该线程结束CPU密集部分或者遇到阻塞/睡眠，才会结束进程。

但是这个操作是OS来做的，不能完全保证事务性，所以这个函数还是要谨慎使用。

线程等待

首先为什么要进行线程等待？

类似于进程等待，如果线程结束但是主线程没有对退出的线程进行回收，那么这个线程就会一直存在，在进程的地址空间内。
每个线程在进程的虚拟地址空间中的共享区都会有一份自己的信息，如果线程退出不回收，那么其他线程就不会复用退出线程的地址空间，有可能造成后期无法再创建新的线程。

pthread_join

在这里插入图片描述

参数：

thread：线程id。
retval：它指向一个指针，后者指向线程的返回值。
1. 如果thread线程通过return返回,retval所指向的单元里存放的是thread线程函数的返回值。
2. 如果thread线程被别的线程调用pthread_ cancel异常终掉,retval所指向的单元里存放的是常数PTHREAD_ CANCELED。
3. 如果thread线程是自己调用pthread_exit终止的,retval所指向的单元存放的是传给pthread_exit的参数。
4. 如果对thread线程的终止状态不感兴趣,可以传NULL给value_ ptr参数。

调用这个函数一般不关注线程的返回结果，其实是为了等待线程结束然后继续执行程序的逻辑。

这个函数是一个阻塞等待函数，程序如果调用这个函数，就会一直阻塞在这里，直到有线程结束。

void *ThreadEntry(void *arg)
{
    (void) arg;

    std::cout << "Thread 1." << std::endl;
    while (true);

    return nullptr;
}

int main(void)
{
    pthread_t tid;
    pthread_create(&tid, nullptr, ThreadEntry, nullptr);
 
    std::cout << "Main Thread." << std::endl;
    pthread_join(tid, nullptr);

    return 0;
}

在这里插入图片描述

通过pstack 进程id可以看到主线程阻塞在了 pthread_join处。

线程等待其中一个应用场景：

如果主线程需要等待所有其他线程运行完进程汇总的话，就可以使用线程等待他可以确保所有的线程都运行完，自己在汇总，

分离线程

分离线程就很像信号那篇博客里说的：子进程退出后会给父进程发送一个信号SIGCHLD，但是我们可以通过signal系统调用进行信号捕捉，然后忽略掉它。

这样就可以解决子进程退出，父进程没有回收而造成的僵尸进程的问题。

默认情况下，新创建的线程是需要被等待的，如果不对其进行pthread_join操作，就无法释放资源，造成系统内存泄漏。
但是如果我们并不关注线程的返回值，pthread_join就会是一个降低效率的操作，因为它是阻塞等待。所以当我们将不关心返回值的线程分离，当线程退出时，线程会自动释放。

在这里插入图片描述

参数：

thread：线程id。

如果希望分离自己可以这样操作。

pthread_detach(pthread_self())

有一个思考：如果将一个线程分离出去了，进程退出了，分离出去的线程还会跑吗？

void *ThreadEntry(void *arg)
{
    while (true)
    {
        std::cout << (char *)arg << std::endl;
        sleep(1);
    }
}

int main(void)
{
    pthread_t tid;
    pthread_create(&tid, nullptr, ThreadEntry, (void*)"Thread running...");
    
    for (int i = 0; i < 5; i++)
    {
        std::cout << "Main Thread runing...." << std::endl;
        sleep(1);
    } 
    exit(1);

    return 0;
}

在这里插入图片描述

结果如上，不管线程是不是分离出去，只要进程退出，线程还是会退出。

因为创建出来的线程的信息在进程的地址空间中保存着，当进程退出，虚拟地址空间会被释放，所以线程自然也就退出了。

叮~?

Gerald Kwok

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Linux线程控制

Linux线程控制线程控制的相关函数不是系统调用是库函数。线程控制的函数库是POSIX线程库。POSIX是一个标准，规定了操作系统需要写哪些接口供程序员来使用。与线程有关的函数大多数都是以pthread_开头的。需要使用线程函数库的时候需要引入头文件 <pthread>，并且因为该库是一个动态库，在写编译命令的时候需要在后面加上 -lpthread链接这个库。创建线程...
复制链接

扫一扫