【linux 多线程并发】线程本地数据存储的两种方式，每个线程可以有同名全局私有数据，以及两种方式的性能分析_linux线程本地存储

最新推荐文章于 2024-09-10 19:16:08 发布

2401_86400321

最新推荐文章于 2024-09-10 19:16:08 发布

阅读量792

点赞数 11

分类专栏：学习资料blog.csdn.net/m0_55035988 面试辅导大厂内推技术交流blog.csdn.net/m0_55035988 文章标签： linux java 运维

本文链接：https://blog.csdn.net/2401_86400321/article/details/142095569

版权

学习资料blog.csdn.net/m0_55035988 同时被 3 个专栏收录

7 篇文章 0 订阅

订阅专栏

面试辅导大厂内推

7 篇文章 0 订阅

订阅专栏

技术交流blog.csdn.net/m0_55035988

7 篇文章 0 订阅

订阅专栏

结尾

前言

现代的CPU都是多core处理器，而且在intel处理器中每个core又可以多个processor，形成了多任务并行处理的硬件架构，在服务器端的处理器上架构又有一些不同，传统的采用SMP，也就是对称的多任务处理架构，每个任务都可以对等的访问所有内存，外设等，而如今在ARM系列CPU上，多采用NUMA架构，它将CPU核分了几个组，给每个组的CPU core分配了对应的内存和外设，CPU访问对应的内存和外设时速度最优，跨组访问时性能会降底一些。

随着硬件技术的持续发展，它们对一般应用的性能优化能力越来越强，同时对于服务器软件的开发，提出更高要求，要想达到极高的并发和性能，就需要充分利用当前硬件架构的特点，对它们进行压榨。那么，我们的应用至少也是要采用多任务架构，不管是多线程还是多进程的多任务架构，才可以充分利用硬件的资源，达到高效的处理能力。

当然多任务框架的采用，不仅仅是多线程的执行，需要对多任务下带来的问题进行处理，如任务执行返回值获取，任务间数据的传递，任务执行次序的协调；当然也不是任务越多处理越快，要避免线程过多导致操作系统夯住，也要防止任务空转过快导致CPU使用率飙高。

本专栏主要介绍使用多线程与多进程模型，如何搭建多任务的应用框架，同时对多任务下的数据通信，数据同步，任务控制，以及CPU core与任务绑定等相关知识的分享，让大家在实际开发中轻松构建自已的多任务程序。

概述

linux 系统中线程是一种经量级的任务，同一进程的多个线程是共享进程内存的；当我们定义一个全局变量时，它可以被当前进程下的所有线程访问，如何来定义一个线程本地的变量呢？

TLS方式

在linux 系统下一般有两种方式来定义线程本地变量，这一技术叫做Thread Local Storage, TLS。

GCC的__thread关键字
键值对API

TLS生命周期

线程本地变量的生命周期与线程的生命周期一样，当线程结束时，线程本地变量的内存就会被回收。

当然这里需要特别注意，当线程本地变量为指针类型时，动态分配的内存空间，系统并不会自动回收，只是将指针变量置为NULL，为了避免内存泄漏，需要在线程退出时主动进行清理动作，这将在后面的博文中介绍。

线程pthread结构内存

在介绍线程本地变量存储时，就不得不介绍一下pthread结构的内存，它定义了线程的重要数据结构，描述了用户状态线程的完整信息。

pthread 结构非常复杂，通过 specific_1stblock 数组和特定的辅助数组与 TLS 相关。

#define PTHREAD\_KEY\_2NDLEVEL\_SIZE 32
#define PTHREAD\_KEY\_1STLEVEL\_SIZE \
 ((PTHREAD\_KEYS\_MAX + PTHREAD\_KEY\_2NDLEVEL\_SIZE - 1) \
 / PTHREAD\_KEY\_2NDLEVEL\_SIZE)

struct pthread
{
    union
  {
#if !TLS\_DTV\_AT\_TP
    /\* This overlaps the TCB as used for TLS without threads (see tls.h). \*/
    tcbhead\_t header;
#else
    struct
    {
      int multiple_threads;
      int gscope_flag;
    } header;
#endif

    void \*__padding[24];
  };

  list\_t list;
  pid\_t tid;

  ...
  struct pthread\_key\_data
  {
    /\* Sequence number. We use uintptr\_t to not require padding on
 32- and 64-bit machines. On 64-bit machines it helps to avoid
 wrapping, too. \*/
    uintptr\_t seq;

    /\* Data pointer. \*/
    void \*data;
  } specific_1stblock[PTHREAD_KEY_2NDLEVEL_SIZE];

  /\* Two-level array for the thread-specific data. \*/
  struct pthread\_key\_data \*specific[PTHREAD_KEY_1STLEVEL_SIZE];

  /\* Flag which is set when specific data is set. \*/
  bool specific_used;
  ...
}

__thread 关键字

该关键字可用于在 GCC/Clang 编译环境中声明 TLS 变量，该关键字不是 C 标准，并且因编译器不同而有差异；

原理介绍

使用 __thread关键字声明的变量存储在线程的pthred 结构与堆栈空间之间，也就是说，在内存布局方面，从高地址到底层地址的内存分布为：pthred结构、可变区和堆栈区（堆栈的底部和可变区的顶部是连续的）；

在这种方式下的线程本地变量，变量的类型不能是复杂的类型，如C++的class类型，而且动态申请的变量空间，需要主动释放，线程结束时，只是对变量空间回收，而对应的动态内存则会泄漏。

代码举例

/\* 
 \* created by senllang 2024/1/1 
 \* mail : study@senllang.onaliyun.com 
 \* Copyright (C) 2023-2024, senllang
 \*/
#include <pthread.h>
#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <unistd.h>

#define THREAD\_NAME\_LEN 32
__thread char threadName[THREAD_NAME_LEN];
__thread int delay = 0;

typedef struct ThreadData 
{
    char name[THREAD_NAME_LEN];
    int delay;
}ThreadData;

void \*threadEntry(void \*arg) 
{
    int ret = 0;
    int i = 0;
    ThreadData \* data = (ThreadData \*)arg;

    printf("[%lu] thread entered \n", pthread\_self());

    strncpy(threadName, data->name, THREAD_NAME_LEN);
    delay = data->delay;

    for(i = 0; i < delay; i++)
    {
        usleep(10);
    }
    printf("[%lu] %s exiting after delay %d.\n", pthread\_self(), threadName, delay);
    pthread\_exit(&ret);
}

int main(int argc, char \*argv[]) 
{
    pthread\_t thid1,thid2,thid3;
    void \*ret;
    ThreadData args1 = {"thread 1", 50000}, args2 = {"thread 2", 25000}, args3 = {"thread 3", 12500};

    strncpy(threadName, "Main Thread", THREAD_NAME_LEN);

    if (pthread\_create(&thid1, NULL, threadEntry, &args1) != 0) 
    {
        perror("pthread\_create() error");
        exit(1);
    }

    if (pthread\_create(&thid2, NULL, threadEntry, &args2) != 0) 
    {
        perror("pthread\_create() error");
        exit(1);
    }

    if (pthread\_create(&thid3, NULL, threadEntry, &args3) != 0) 
    {
        perror("pthread\_create() error");
        exit(1);
    }

    if (pthread\_join(thid1, &ret) != 0) 
    {
        perror("pthread\_create() error");
        exit(3);
    }

    if (pthread\_join(thid2, &ret) != 0) 
    {
        perror("pthread\_create() error");
        exit(3);
    }

    if (pthread\_join(thid3, &ret) != 0) 
    {
        perror("pthread\_create() error");
        exit(3);
    }

    printf("[%s]all thread exited delay:%d .\n", threadName, delay);
}

每个线程定义了两个线程本地变量 threadName, delay，在线程处理函数中，对它们赋值后，再延迟一段时间，然后输出这两个变量值，结果可以看到每个线程的本地变量值都不一样，可以独立使用。

运行结果：

[senllang@hatch example_04]$ gcc -lpthread threadLocalStorage_gcc.c 
[senllang@hatch example_04]$ ./a.out 
[139945977145088] thread entered 
[139945960359680] thread entered 
[139945968752384] thread entered 
[139945960359680] thread 3 exiting after delay 12500.
[139945968752384] thread 2 exiting after delay 25000.
[139945977145088] thread 1 exiting after delay 50000.
[Main Thread]all thread exited delay:0 .

线程API方式

另一种使用线程本地变量的方式，是使用线程key相关的API，它分为两类，一是创建和销毁接口，另一类是变量的设置与获取接口。

这种方式下，线程的本地数据存储在 pthread结构中，其中specific_1stblock，specific两个数组按key值索引，并存储对应的线程本地数据；

线程本地数据的数量，在这种方式下是有限的。

创建与销毁接口

#include <pthread.h> 
int pthread\_key\_create(pthread\_key\_t \*key, void(\*destructor)(void\*));
int pthread\_key\_delete(pthread\_key\_t key);

创建接口，获取一个 pthread_key_t变量的值，其实就是内存获取一个键值来存储数据，第二个参数destructor传递一个销毁数据的方法，当本地数据为复杂数据类型，或者动态申请内存时，在线程退出时进行清理调用。

在线程使用完后，需要释放对应的key。

设置本地变量值接口

#include <pthread.h> 
int pthread\_setspecific(pthread\_key\_t key, const void \* value);
void \* pthread\_getspecific(pthread\_key\_t key);

这里设置线程的本地变量值，和获取线程本地变量值；

在不同线程中设置时，就会只设置当前线程的本地变量，不影响其它线程。

为了做好运维面试路上的助攻手，特整理了上百道 【运维技术栈面试题集锦】 ，让你面试不慌心不跳，高薪offer怀里抱！

这次整理的面试题，小到shell、MySQL，大到K8s等云原生技术栈，不仅适合运维新人入行面试需要，还适用于想提升进阶跳槽加薪的运维朋友。

本份面试集锦涵盖了

174 道运维工程师面试题
128道k8s面试题
108道shell脚本面试题
200道Linux面试题
51道docker面试题
35道Jenkis面试题
78道MongoDB面试题
17道ansible面试题
60道dubbo面试题
53道kafka面试
18道mysql面试题
40道nginx面试题
77道redis面试题
28道zookeeper

总计 1000+ 道面试题，内容又全含金量又高

174道运维工程师面试题

1、什么是运维?

2、在工作中，运维人员经常需要跟运营人员打交道，请问运营人员是做什么工作的?

3、现在给你三百台服务器，你怎么对他们进行管理?

4、简述raid0 raid1raid5二种工作模式的工作原理及特点

5、LVS、Nginx、HAproxy有什么区别?工作中你怎么选择?

6、Squid、Varinsh和Nginx有什么区别，工作中你怎么选择?

7、Tomcat和Resin有什么区别，工作中你怎么选择?

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义？

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题，mysql如何减少主从复制延迟?

y有什么区别?工作中你怎么选择?

6、Squid、Varinsh和Nginx有什么区别，工作中你怎么选择?

7、Tomcat和Resin有什么区别，工作中你怎么选择?

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义？

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题，mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

2401_86400321

关注

11
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
【linux 多线程并发】线程本地数据存储的两种方式，每个线程可以有同名全局私有数据，以及两种方式的性能分析_linux线程本地存储

现代的CPU都是多core处理器，而且在intel处理器中每个core又可以多个processor，形成了多任务并行处理的硬件架构，在服务器端的处理器上架构又有一些不同，传统的采用SMP，也就是对称的多任务处理架构，每个任务都可以对等的访问所有内存，外设等，而如今在ARM系列CPU上，多采用NUMA架构，它将CPU核分了几个组，给每个组的CPU core分配了对应的内存和外设，CPU访问对应的内存和外设时速度最优，跨组访问时性能会降底一些。
复制链接

扫一扫

专栏目录