1. 概述
线程
是轻量级的进程(LWP:light weight process),在Linux环境下线程的本质
仍是进程。
操作系统会以进程为单位,分配系统资源,所以我们也说,进程是资源分配的最小单位。线程是操作系统调度执行的最小单位.
安装线程 man page,命令:
sudo apt-get install manpages-posix-dev
1.1 多进程和多线程
线程是windows上的概念, 早期的linux中没有线程, 只有进程
多线程程序占用的系统资源少, 多线程会提升程序的执行效率
linux中的线程是通过进程改过来的, 对应内核来说在linux中只有进程没有线程
- 进程与线程关系:
下图代表一个进程的虚拟地址空间
# 线程创建之前:
- 进程独占这个虚拟地址空间
# 线程创建之后(假设创建了n个子线程)
- 进程退化->线程->主线程
- 这些线程共享同一个虚拟地址空间(不是完全共享)
# 线程之间(主线程/子线程)共享什么?
用户区:
- 代码区共享
- 堆区和全局数据区的数据
- 动态库加载区
- 环境变量
- 命令行参数
内核区:
- 当前的工作目录
- umask掩码
- 文件描述符表
# 线程之间(主线程/子线程)不共享什么?
用户区:
- 栈区, 根据线程的个数将栈区平均分成若干份, 每个线程占一份
内核区:
- 线程ID不同
- 寄存器存储的线程状态不同
# 线程和进程的定位?
进程是系统资源的最小分配单位
线程是最小的资源执行单位
1.2 创建线程相关函数
1.2.1 线程创建
#include <pthread.h>
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
参数:
- thread: 传出参数, 线程创建成功之后, 通过这个参数得到了线程的ID
- attr: 线程属性, 一般使用默认属性, 指定为NULL
- start_routine: 函数指针, 指向的函数是子线程的处理动作(回调函数)
- arg: 作为实参传递给回调函数 start_routine
返回值:
成功: 0
失败: 返回错误号
1.2.2 获取线程ID
#include <pthread.h>
// 得到当前线程的线程ID
pthread_t pthread_self(void);
1.2.3 线程退出
// 退出当前线程, 不会对其他线程造成影响
// 这个函数在主线程, 子线程中都是可以使用的
void pthread_exit(void *retval);
参数:
retval: 线程退出时候的状态, 这个值在线程回收的时候可以被捕捉到, 不关心这个状态指定为NULL
1.2.4 回收子线程资源
// 在程序中创建了若干个子线程, 这个线程在内核中会有一个叫做tcb的东西, 线程在退出的时候自己无法释放
// 这tcb的释放可以交给主线程去做
// 这函数是一个阻塞函数, 子线程不结束, 这个函数一直阻塞, 子线程退出, 该函数解除阻塞, 回收子线程资源
// 这个函数调用一次只能回收一个子线程资源
int pthread_join(pthread_t thread, void **retval);
参数:
- thread: 要回收的子线程的线程ID
- retval: 接收一下子线程退出的时候返回的地址
1.2.5 线程分离
线程分离
解决了子线程退出tcb资源回收问题
// 线程分离之后, 子线程退出, 他的tcb资源不需要主线程去回收了, 操作系统会进行资源的回收
int pthread_detach(pthread_t thread);
参数: 要和主线程进行分离的子线程的线程ID