linux 线程

ShenHang_

已于 2023-09-12 10:19:19 修改

阅读量260

点赞数

分类专栏： Linux基础文章标签： linux

于 2020-06-16 23:05:22 首次发布

本文链接：https://blog.csdn.net/ShenHang_/article/details/106763767

版权

Linux基础专栏收录该内容

42 篇文章 4 订阅

订阅专栏

线程

LWP：light weight process 轻量级的进程，本质仍是进程(在Linux环境下)
进程：独立地址空间，拥有PCB
线程：也有PCB，但没有独立的地址空间(共享)
区别：在于是否共享地址空间。独居(进程)；合租(线程)。
Linux下：
线程：最小的执行单位
进程：最小分配资源单位，可看成是只有一个线程的进程。
在这里插入图片描述

Linux内核线程实现原理

类Unix系统中，早期是没有“线程”概念的，80年代才引入，借助进程机制实现出了线程的概念。因此在这类系统中，进程和线程关系密切。
1.轻量级进程(light-weight process)，也有PCB，创建线程使用的底层函数和进程一样，都是clone
2.从内核里看进程和线程是一样的，都有各自不同的PCB，但是PCB中指向内存资源的三级页表是相同的
3.进程可以蜕变成线程
4.线程可看做寄存器和栈的集合
5.在linux下，线程最是小的执行单位；进程是最小的分配资源单位
查看LWP号：ps –Lf pid 查看指定线程的lwp号
注意：LWP是CPU分配时间轮片的依据，而线程id是进程中用来区分线程的，两者不是一回事，不要搞混了。
三级映射：进程PCB --> 页目录(可看成数组，首地址位于PCB中) --> 页表 --> 物理页面 --> 内存单元
两个线程具有各自独立的PCB，但共享同一个页目录，也就共享同一个页表和物理页面。所以两个PCB共享一个地址空间。
如果复制对方的地址空间，那么就产出一个“进程”；如果共享对方的地址空间，就产生一个“线程”。
因此：Linux内核是不区分进程和线程的。只在用户层面上进行区分。所以，线程所有操作函数 pthread_* 是库函数，而非系统调用。

线程共享资源

1.文件描述符表
2.每种信号的处理方式（捕捉、忽略还是执行默认动作）
3.当前工作目录
4.用户ID和组ID
5.内存地址空间 (.text/.data/.bss/heap/共享库，即去掉栈)

线程非共享资源

1.线程id
2.处理器现场和栈指针(内核栈)
3.独立的栈空间(用户空间栈)，用户栈是给线程函数运行提供存储空间
4.errno变量
5.信号屏蔽字
6.调度优先级

线程优、缺点

优点： 1. 提高程序并发性 2. 开销小 3. 数据通信、共享数据方便
缺点： 1. 线程中的函数都是库函数，不稳定 2. 调试、编写困难、gdb不支持 3. 对信号支持不好
优点相对突出，缺点均不是硬伤。Linux下由于实现方法导致进程、线程差别不是很大。

pthread_self函数

获取线程ID。其作用对应进程中 getpid() 函数。

pthread_t pthread_self(void);

返回值：成功：0；失败：永远不会失败
线程ID：pthread_t类型，本质：在Linux下为unsigned long(%lu)，其他系统中可能是结构体实现
线程ID是进程内部，识别标志。(两个进程间，线程ID允许相同)
注意：不应使用全局变量 pthread_t tid在子线程中通过pthread_create传出参数来获取线程ID;而应使用pthread_self。

pthread_create函数

创建一个新线程。其作用，对应进程中fork() 函数。

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);

返回值：成功：0；失败：错误号 -----Linux环境下，所有线程特点，失败均直接返回错误号。
参数：
pthread_t：当前Linux中可理解为：typedef unsigned long int pthread_t;
参数1：传出参数，保存系统为我们分配好的线程ID
参数2：通常传NULL，表示使用线程默认属性。若想使用具体属性也可以修改该参数。
参数3：函数指针，指向线程主函数(线程体)，该函数运行结束，则线程结束。
参数4：线程主函数执行期间所使用的参数。
在一个线程中调用pthread_create()创建新的线程后，当前线程从pthread_create()返回继续往下执行，而新的线程所执行的代码由我们传给pthread_create的函数指针start_routine决定。start_routine函数接收一个参数，是通过pthread_create的arg参数传递给它的，该参数的类型为void *，这个指针按什么类型解释由调用者自己定义。start_routine的返回值类型也是void *，这个指针的含义同样由调用者自己定义。start_routine返回时，这个线程就退出了。

例：循环创建多个线程，每个线程打印自己是第几个被创建的线程。
思考：将pthread_create函数参4修改为(void*)&i，将线程主函数内改为 i=*((int *)arg) 是否可以？

#include <pthread.h>
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

void *tfn(void *arg)
{
	int i = (int)arg;
	printf("I'm %dth thread, Thread_ID = %lu\n", i+1, pthread_self());

	return NULL;
}

int main(int argc, char *argv[])
{
	int n = 5, i;
	pthread_t tid;

	if (argc == 2)
		n = atoi(argv[1]);

	for (i = 0; i < n; i++) {
		pthread_create(&tid, NULL, tfn, (void *)i);
		//将i转换为指针，在tfn中再强转回整型。
	}
	//sleep(1);//即使主线程等待1秒，内核也不一定会调度新创建的线程执行
	
	printf("I am main, and I am not a process, I'm a thread!\n" 
			"main_thread_ID = %lu\n", pthread_self());

    pthread_exit(NULL);//结束主控线程
    
	//return 0;//进程结束
}

编译时要链接线程库 -lpthread
在这里插入图片描述

按上面的思考题进行修改，执行的结果如下（当然，每次执行都是不同的结果）：

分析，为什么会出现这种现象呢，其实很好理解，传指针给线程函数后，主控线程可能会对i进行修改，所以这里不能传指针，而是应该值传递。
再分析为什么形参是指针类型，却可以传值呢，因为这里我们使用int是4Byte，32bit系统自然没问题，如果是64bit系统，那么int转void*时高位会自动补0，同样void*转int时，高位会被截断，所以这样做是可以的。

pthread_exit函数

将单个线程退出

void pthread_exit(void *retval);

参数：传出参数 retval表示线程退出状态，通常传NULL
思考：使用exit将指定线程退出，可以吗？
结论：线程中，禁止使用exit函数，否则会退出整个进程，从而导致进程内所有线程全部退出。
多线程环境中，应尽量少用，或者不使用exit函数，取而代之使用pthread_exit函数，将单个线程退出。任何线程里exit导致进程退出，其他线程未工作结束，主控线程退出时不能return或exit。
另注意，pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的，不能在线程函数的栈上分配，因为当其它线程得到这个返回指针时线程函数已经退出了。

pthread_join函数

阻塞等待线程退出，获取线程退出状态，其作用对应进程中 waitpid() 函数。

int pthread_join(pthread_t thread, void **retval);

成功：0；失败：错误号
参数：
thread：线程ID，通过pthread_create的第一个传出参数可以得到；
retval：传出参数，存储线程结束状态。

参数retval的用法（重点！！！）：
调用该函数的线程将阻塞等待，直到id为thread的线程终止。thread线程以不同的方法终止，通过pthread_join得到的终止状态是不同的，总结如下：
1.如果thread线程通过return返回，retval所指向的单元里存放的是thread线程函数的返回值。
2.如果thread线程被别的线程调用pthread_cancel异常终止掉，retval所指向的单元里存放的是常数PTHREAD_CANCELED，即-1。
3.如果thread线程是自己调用pthread_exit终止的，retval所指向的单元存放的是传给pthread_exit的参数。
4.如果对thread线程的终止状态不感兴趣，可以传NULL给retval参数。

例：使用pthread_join函数将循环创建的多个子线程回收。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <pthread.h>

int var = 100;

void *tfn(void *arg)
{
    int i;
    i = (int)arg;
    
    sleep(i);//这是为了保证多个线程的执行顺序
    if (i == 1) 
	{
        var = 200;
        printf("var = %d\n", var);
        return (void *)var;

    } else  if (i == 3) 
	{
        var = 300;
        printf("I'm %dth pthread, pthread_id = %lu\n var = %d\n", i+1, pthread_self(), var);
        pthread_exit((void *)var);

    } else 
	{
        printf("I'm %dth pthread, pthread_id = %lu\n var = %d\n", i+1, pthread_self(), var);
        pthread_exit((void *)var);
    }

    return NULL;
}

int main(void)
{
    pthread_t tid[5];
    int i;
    int *ret[5];  

    for (i = 0; i < 5; i++)
        pthread_create(&tid[i], NULL, tfn, (void *)i);

    for (i = 0; i < 5; i++) 
	{
        pthread_join(tid[i], (void **)&ret[i]);
        printf("-------%d 's ret = %d\n", i, (int)ret[i]);
    }
        
    printf("I'm main pthread tid = %lu\t var = %d\n", pthread_self(), var);

    return 0;
}

在这里插入图片描述
这也说明了线程共享全局变量。

pthread_detach函数

实现线程分离

int pthread_detach(pthread_t thread);

成功：0；失败：错误号
线程分离状态：指定该状态，线程主动与主控线程断开关系。该线程结束后，其退出状态不由其他线程获取，而直接自己自动释放，线程结束后不需要使用pthread_join回收。网络、多线程服务器常用。
进程若有该机制，将不会产生僵尸进程。僵尸进程的产生主要由于进程死后，大部分资源被释放，一点残留资源仍存于系统中，导致内核认为该进程仍存在。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <pthread.h>

void *tfn(void *arg)
{
	int n = 3;

	while (n--) {
		printf("thread count %d\n", n);
		sleep(1);
	}

	//return (void *)1;
    pthread_exit((void *)1);
}

int main(void)
{
	pthread_t tid;
	void *t_ret;
	int err;

	pthread_create(&tid, NULL, tfn, NULL);
	pthread_detach(tid);         //让线程分离  ----自动退出,无系统残留资源，线程结束后不需要使用pthread_join回收


	//如果pthread_detach后再pthread_join，pthread_join是会失败的，返回22。
	err = pthread_join(tid, &t_ret);
    printf("-------------err= %d\n", err);
	if (err != 0)
		fprintf(stderr, "thread_join error: %s\n", strerror(err));
	else
		fprintf(stderr, "thread exit code %d\n", (int)t_ret);

	return 0;
}

在这里插入图片描述

pthread_cancel函数

杀死(取消)线程，其作用，对应进程中的 kill() 函数。

int pthread_cancel(pthread_t thread);

成功：0；失败：错误号
【注意】：线程的取消并不是实时的，而有一定的延时。需要等待线程到达某个取消点(检查点)。
类似于玩游戏存档，必须到达指定的场所(存档点，如：客栈、仓库、城里等)才能存储进度。杀死线程也不是立刻就能完成，必须要到达取消点。
取消点：是线程检查是否被取消，并按请求进行动作的一个位置。通常是一些系统调用creat，open，pause，close，read，write… 执行命令man 7 pthreads可以查看具备这些取消点的系统调用列表。也可参阅 APUE.12.7 取消选项小节。
可粗略认为一个系统调用(进入内核)即为一个取消点。如线程中没有取消点，可以通过调用pthreestcancel函数自行设置一个取消点。
被取消的线程，退出值定义在Linux的pthread库中。常数PTHREAD_CANCELED的值是-1。可在头文件pthread.h中找到它的定义：#define PTHREAD_CANCELED ((void *) -1)。因此当我们对一个已经被取消的线程使用pthread_join回收时，得到的返回值为-1。

例：终止线程的三种方法。注意“取消点”的概念。

#include <stdio.h>
#include <unistd.h>
#include <pthread.h>
#include <stdlib.h>


void *tfn1(void *arg)
{
	printf("thread 1 returning\n");

	return (void *)111; 
}

void *tfn2(void *arg)
{
	printf("thread 2 exiting\n");
	pthread_exit((void *)222);
}

void *tfn3(void *arg)
{
	while (1) {
		//printf("thread 3: I'm going to die in 3 seconds ...\n");
		//sleep(1);

		pthread_testcancel();	//自己添加取消点,pthread_testcancel是线程库函数
	}

    return (void *)666;
}

int main(void)
{
	pthread_t tid;
	void *tret = NULL;

	pthread_create(&tid, NULL, tfn1, NULL);
	pthread_join(tid, &tret);
	printf("thread 1 exit code = %d\n\n", (int)tret);

	pthread_create(&tid, NULL, tfn2, NULL);
	pthread_join(tid, &tret);
	printf("thread 2 exit code = %d\n\n", (int)tret);

	pthread_create(&tid, NULL, tfn3, NULL);
	sleep(3);
    pthread_cancel(tid);
	pthread_join(tid, &tret);
	printf("thread 3 exit code = %d\n", (int)tret);

	return 0;
}

在这里插入图片描述

NPTL

1.察看当前pthread库版本getconf GNU_LIBPTHREAD_VERSION
2.NPTL实现机制(POSIX)，Native POSIX Thread Library，NPTL使Linux内核可以非常有效的运行使用POSIX线程标准写的程序。
3.使用线程库时gcc指定 –lpthread

线程使用注意事项

1.主线程退出其他线程不退出，主线程应调用pthread_exit
2.避免僵尸线程
pthread_join
pthread_detach
pthread_create指定分离属性
3.malloc和mmap申请的内存可以被其他线程释放
4.应避免在多线程模型中调用fork，除非马上exec，子进程中只有调用fork的线程存在，其他线程在子进程中均pthread_exit
5.信号的复杂语义很难和多线程共存，应避免在多线程引入信号机制

两种线程id打印

#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <string.h>
#include <sys/syscall.h>

void print(const char *s)
{
        pid_t pid = getpid();
        pthread_t tid = pthread_self();
        pid_t sys_tid = syscall(SYS_gettid);
        printf("%s tid %u(%#x)\n", s, tid, tid);
        printf("sys_tid(LWP): %u\n", sys_tid);
        printf("pid: %u\n", pid);
}

void *thread_func(void *arg)
{
        print("new thread: ");
}

int main(void)
{
        int err;
        pthread_t tid;
        err = pthread_create(&tid, NULL, thread_func, NULL);
        if(err != 0)
        {
                printf("can't create thread: %s\n",strerror(err));
        }
        sleep(5);
        printf("------------------------------------------\n");
        print("main thread: ");
        sleep(1);
        return 0;

}

在这里插入图片描述

ShenHang_

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
linux 线程

线程LWP：light weight process 轻量级的进程，本质仍是进程(在Linux环境下)进程：独立地址空间，拥有PCB线程：也有PCB，但没有独立的地址空间(共享)区别：在于是否共享地址空间。独居(进程)；合租(线程)。Linux下：线程：最小的执行单位进程：最小分配资源单位，可看成是只有一个线程的进程。Linux内核线程实现原理类Unix系统中，早期是没有“线程”概念的，80年代才引入，借助进程机制实现出了线程的概念。因此在这类系统中，进程和线程关系密切。1.轻量级进
复制链接

扫一扫

专栏目录