【Linux】线程控制|POSIX线程库|多线程创建|线程终止|等待|线程分离|线程空间布局

最新推荐文章于 2024-11-03 12:02:27 发布

敷敷_

最新推荐文章于 2024-11-03 12:02:27 发布

阅读量780

点赞数 20

分类专栏： Linux 文章标签： linux 运维服务器程序人生开发语言

本文链接：https://blog.csdn.net/m0_67367079/article/details/141108402

版权

Linux 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

POSIX线程库

pthread线程库是 POSIX线程库的一部分，POSIX线程库也叫原生线程库;

遵守 POSIX标准：与线程有关的函数构成了一个完整的系列，绝大多数函数的名字都是以“pthread_”开头的
要使用这些函数库，要通过引入头文<pthread.h>
链接这些线程函数库时要使用编译器命令的 “-lpthread” 选项;

成功返回0，失败返回-1

多线程创建

主线程创建一批线程;

没有在循环创建中添加sleep();

void* handler(void* arg)
{
    const char* name = (const char*)arg;
    while(true)
    {
        cout<<"new thread sucess name:"<<name<<endl;
        sleep(1);
    }
}


int main()
{
    pthread_t tid;
    char namebuff[64];
    for(int i = 0;i<5;i++)  
    {
    //格式化
    snprintf(namebuff,sizeof(namebuff),"%s：%d","thread:",i+1);
    pthread_create(&tid,nullptr,handler,namebuff);  //
    }

    while(true)
    {
        cout << "new thread create success, I am main thread" << endl;
        sleep(1);
    }

    return 0;
}

观察发现，线程编号不是我们预期的从1.2.3..开始的，而是到了最后一个线程名字；

而且线程确实创建出来了；

添加循环创建时sleep()函数 ;将数组地址改为拷贝

//把参数封成结构体
class ThreadData
{
public:
    pthread_t tid;
    char namebuffer[64];
};
 
void* start_routine(void* args)
{
   ThreadData* td = static_cast<ThreadData*>(args);//static_cast 安全的进行强制类型转换，C++11
   int cnt = 10;
    while(cnt)
    {
        cout << "cnt:" << cnt-- << "  &cnt:" << &cnt << endl;
        sleep(1);
    }
    delete td;
    return nullptr;
}
 
int main()
{
#define NUM 10
    //创建一批线程
    for(int i = 0; i < NUM; i++)
    {
        ThreadData* td = new ThreadData();//每次循环new的都是一个新对象
        snprintf(td->namebuffer, sizeof(td->namebuffer), "%s:%d", "thread", i+1);//i+1 使线程下标从1开始
        pthread_create(&td->tid, nullptr, start_routine, td);
    }
    //主线程
    while(1)
    {
        cout << "new thread create success, name:main thread" << endl;
        sleep(1);
    }
 
    return 0;
}

主线程创建新线程太快了，新线程都没有机会运行，主线程就把10个新线程创建完毕了，
而传参namebuffer传过去的是缓冲区namebuffer的起始地址，
第十个线程创建完成之后，缓冲区的内容都被第十个线程的编号内容覆盖了，所以第一次现象线程的编号都是 10

独立栈结构

线程栈主要用于存储线程的局部变量、函数参数以及调用堆栈。当一个线程开始执行时，它的栈空间会被初始化，并且随着线程的执行，栈空间会被动态地扩展或收缩。

//把参数封成结构体
class ThreadData
{
public:
    pthread_t tid;
    char namebuffer[64];
};
 
void* start_routine(void* args)
{
   ThreadData* td = static_cast<ThreadData*>(args);//static_cast 安全的进行强制类型转换，C++11
   int cnt = 10;
    while(cnt)
    {
        cout << "cnt:" << cnt-- << "  &cnt:" << &cnt << endl;
        sleep(1);
    }
    delete td;
    return nullptr;
}
 
int main()
{
#define NUM 10
    //创建一批线程
    for(int i = 0; i < NUM; i++)
    {
        ThreadData* td = new ThreadData();//每次循环new的都是一个新对象
        snprintf(td->namebuffer, sizeof(td->namebuffer), "%s:%d", "thread", i+1);//i+1 使线程下标从1开始
        pthread_create(&td->tid, nullptr, start_routine, td);
    }
    //主线程
    while(1)
    {
        cout << "new thread create success, name:main thread" << endl;
        sleep(1);
    }
 
    return 0;
}

在函数内部定义的变量叫局部变量，具有临时性，在多线程的情况下依旧适用，因为每个线程都有自己的独立栈结构

获取线程ID

常见获取线程ID的方式有两种：

创建线程时通过输出型参数获得
通过调用pthread_self函数获得

pthread_self

void* start_routine(void* args)
{
    //安全转换
    std::string name = static_cast<const char*>(args);
    while(true)
    {
        std::cout<<name<<" running ...,ID: "<<pthread_self()<<std::endl;
        sleep(1);
    }
}


int main()
{
    pthread_t thread_id;
    
    //创建一个线程
    pthread_create(&thread_id,nullptr,start_routine,(void*)"thread 1:");

    //打印一下主线程的ID
    while(true)
    {
     std::cout<<"main thread"<<" ID: "<<pthread_self()<<std::endl;
        sleep(1);
    }

        // 等待子线程结束
    pthread_join(thread_id, NULL);
    return 0;
}

线程终止

如果需要只终止某个线程而不终止整个进程

可以有三种方法:

从线程函数return。这种方法对主线程不适用,从main函数return相当于调用exit，整个进程退出
线程可以调用 pthread_ exit 终止自己
一个线程可以调用 pthread_ cancel 终止同一进程中的另一个线程

return终止线程

在多线程程序中，return关键字的使用有所不同

当非主线程时，仅表示该线程将终止其执行；在main函数中使用return则意味着整个进程将退出，这会导致进程的所有资源被释放。

用例

主线程创建多个新线程后，休眠2秒，然后进行return，那么整个进程也就退出了

class ThreadData
{
public:
    pthread_t tid;
    char namebuffer[64];
};
 
void* start_routine(void* args)
{
   ThreadData* td = static_cast<ThreadData*>(args);//static_cast 安全的进行强制类型转换，C++11
   int cnt = 10;
    while(cnt)
    {
        cout << "new thread create success, name:" << td->namebuffer << "  cnt:" << cnt-- << endl;
        sleep(1);
    }
    delete td;
    return nullptr;
}
 
int main()
{
#define NUM 3
    //创建一批线程
    for(int i = 0; i < NUM; i++)
    {
        ThreadData* td = new ThreadData();
        snprintf(td->namebuffer, sizeof(td->namebuffer), "%s:%d", "thread", i+1);//i+1 使线程下标从1开始
        pthread_create(&td->tid, nullptr, start_routine, td);
    }
    //主线程
    cout << "new thread create success, name:main thread" << endl;
    sleep(2);//主线程两秒后退出
    return 0;
}

如果非主线程执行到return，仅代表该线程结束，线程退出

pthread_exit

函数终止线程

exit 是用来终止进程的，任何一个执行流调用 exit，都会使整个进程退出；
pthread_exit函数的功能就是终止线程；

注意

当pthread_exit()和return时，如果返回值是一个指针，该指针指向的内存空间应该是全局的或者malloc分配的(new 本质也是malloc)，防止后面有其它线程通过该指针访问出错；

当然，为了避免潜在威胁，最好确保返回的指针是指向全局，malloc开辟的。这样可以确保即使线程退出，其他线程仍然可以安全地访问这些内存。不能在线程函数的栈上分配,因为当其它线程得到这个返回指针时线程函数已经退出了；

pthread_cancel

函数取消线程

// 定义一个用于存储线程数据的类
class ThreadData
{
public:
    int number;     // 线程编号
    pthread_t tid;  // 线程ID
    char namebuffer[64]; // 缓冲区，用于存储线程名称
};

// 线程函数
void* start_routine(void* args)
{
    ThreadData* td = static_cast<ThreadData*>(args);
    int cnt = 10;
    while (cnt > 0)
    {
        cout << td->namebuffer << "  cnt:" << cnt-- << endl;
        sleep(1);
    }
    // 使用 pthread_exit 返回线程编号
    pthread_exit((void*)td->number);
}

int main()
{
    vector<ThreadData*> threads; // 用于存储线程数据的向量
#define NUM 5 // 定义要创建的线程数量
    for (int i = 0; i < NUM; i++)     // 创建一批线程
    {
        ThreadData* td = new ThreadData();    // 创建 ThreadData 实例
        td->number = i + 1; // 设置线程编号
        snprintf(td->namebuffer, sizeof(td->namebuffer), "%s:%d", "thread", td->number);
        pthread_create(&td->tid, nullptr, start_routine, td);
        threads.push_back(td);    // 把每个线程的信息 push 到 threads 向量中
    }
    // 主线程
    for (auto& iter : threads)
    {
        // 输出创建成功的线程信息
        cout << "create thread: " << iter->namebuffer << " : " << iter->tid << " success" << endl;
    }
    sleep(5);   // 主线程休眠5秒
    // 取消线程
    for (auto& iter : threads)
    {
        // 取消线程
        pthread_cancel(iter->tid);
        cout << "pthread_cancel: " << iter->namebuffer << endl;
    }
    
    // 等待线程结束
    for (auto& iter : threads)
    {
        void* ret = nullptr;
        int n = pthread_join(iter->tid, &ret);    // 等待线程结束，并获取线程返回值
        // 断言
        assert(n == 0);
        // 输出线程结束的信息和线程退出时返回的值
        cout << "join: " << iter->namebuffer << " success, thread_exit_code: " << (long long)ret << endl;
        delete iter;      // 释放 ThreadData 实例
    }
    // 主线程退出
    cout << "main thread quit" << endl;
    return 0;
}

一个线程被取消，它的退出码是 -1

线程等待

线程跟进程一样，创建后也需要主线程等待回收，如果主线程不对新线程进行等待，如果主线程不对新创建的线程进行等待，那么这个新线程的资源将不会被及时回收。这会导致类似“僵尸进程”的问题，也就是内存泄漏；

已经退出的线程，其空间没有被释放，仍然在进程的地址空间内。
创建新的线程不会复用刚才退出线程的地址空间

退出码问题

void* retval 和 void** retval 有什么关系？？
线程函数start_routine函数的返回值类型也是 void*， start_routine函数的返回值返回到哪里？？
我们怎么获取线程的退出码，即线程的返回值？？

pthread_join函数的参数 void** retval 是一个输出型参数，用来获取线程函数结束时，返回的退出结果
void** retval 是用来获取线程函数返回的退出结果，因为线程函数的返回值是 void*，所以需要用 void** 来接受 void*
注意：线程函数返回的退出结果是返回在线程库当中，参数 void** retval 需要去线程库里面接受才可以返回

线程分离

新创建的线程是 joinable（可以被等待）的。这意味着线程退出后，需要对其执行 pthread_join 操作来释放资源，否则这些资源将不会被释放，从而可能导致系统资源泄漏。如果不关心线程的返回值的话，线程等待pthread_join是一种负担；
可以使用 pthread_detach来分离线程。分离后的线程会在退出时自动释放其资源，无需主线程进行 pthread_join操作。

测试

// 将线程ID转换为字符串
string changeID(const pthread_t& thread_id)
{
    char tid[128];
                 // 将线程ID格式化为十六进制字符串
    snprintf(tid, sizeof(tid), "0x%x", thread_id);
    return tid;
}

// 线程函数
void* start_routine(void* args)
{
    string threadname = static_cast<const char*>(args);
    int cnt = 5;
    while (cnt > 0)
    {
        // 输出线程名称和线程ID 
        cout << threadname << " running..., threadID:" << changeID(pthread_self()) << endl;
        sleep(1);
        cnt--;
    }
    // 线程函数结束
    return nullptr;
}

int main()
{
    pthread_t tid;
    // 创建一个新线程
    pthread_create(&tid, nullptr, start_routine, (void*)"thread 1");
    
    // 分离线程
    pthread_detach(tid); // 分离线程后，线程将在退出时自动释放资源
    
    // 线程默认是 joinable 的，一旦分离，就不允许再使用 pthread_join
    // pthread_join(tid, nullptr); // 这里如果尝试使用 pthread_join 会引发错误
    
    // 获取主线程ID
    string mainID = changeID(pthread_self()); // 主线程ID
    while (1)
    {
        // 输出主线程的信息     由于新线程已经被分离，其ID实际上已经不再有效，只是为了展示。
        cout << "main running..., mainID:" << mainID << ", new threadID:" << changeID(tid) << endl;
        sleep(1);
    }
    return 0;
}

线程ID及地址空间布局

pthread_create函数会产生一个线程ID，存放在第一个参数指向的地址中。该线程ID和前面说的线程ID不是一回事。
前面讲的线程ID属于进程调度的范畴。因为线程是轻量级进程，是操作系统调度器的最小单位，所以需要一个数值来唯一表示该线程。
pthread_create函数第一个参数指向一个虚拟内存单元，该内存单元的地址即为新创建线程的线程ID，属于NPTL线程库的范畴。线程库的后续操作，就是根据该线程ID来操作线程的。