linux系统编程-线程-CSDN博客

进程组，也称之为作业。 BSD 于 1980 年前后向 Unix 中增加的一个新特性。代表一个或多个进程的集合。每个进程都属于一个进程组。在 waitpid 函数和 kill 函数的参数中都曾使用到。操作系统设计的进程组的概念，是为了简化对多个进程的管理。当父进程，创建子进程的时候，默认子进程与父进程属于同一进程组。进程组 ID==第一个进程 ID( 组长进程 ) 。所以，组长进程标识：其进程组 ID== 其进程 ID 可以使用 kill -SIGKILL - 进程组 ID( 负的 ) 来将整个进程组内的进程全部杀死。

【 kill_multprocess.c 】

组长进程可以创建一个进程组，创建该进程组中的进程，然后终止。只要进程组中有一个进程存在，进程组就存在，与组长进程是否终止无关。进程组生存期：进程组创建到最后一个进程离开( 终止或转移到另一个进程组 ) 。一个进程可以为自己或子进程设置进程组 ID。

1.2 创建会话

创建一个会话需要注意以下 6 点注意事项：

1. 调用进程不能是进程组组长，该进程变成新会话首进程 (session header)

2. 该进程成为一个新进程组的组长进程。

3. 需有 root 权限 (ubuntu 不需要 )

4. 新会话丢弃原有的控制终端，该会话没有控制终端

5. 该调用进程是组长进程，则出错返回

6. 建立新会话时，先调用 fork, 父进程终止，子进程调用 setsid()

1.3 getsid 函数

获取进程所属的会话 ID

pid_t getsid(pid_t pid); 成功：返回调用进程的会话 ID ；失败： -1 ，设置 errno

pid 为 0 表示察看当前进程 session ID

ps ajx 命令查看系统中的进程。参数 a 表示不仅列当前用户的进程，也列出所有其他用户的进程，参数 x 表示不仅列有控制终端的进程，也列出所有无控制终端的进程，参数 j 表示列出与作业控制相关的信息。组长进程不能成为新会话首进程，新会话首进程必定会成为组长进程。

1.4 setsid 函数

创建一个会话，并以自己的 ID 设置进程组 ID ，同时也是新会话的 ID 。

pid_t setsid(void); 成功：返回调用进程的会话 ID ；失败： -1 ，设置 errno

调用了 setsid 函数的进程，既是新的会长，也是新的组长。

练习： fork 一个子进程，并使其创建一个新会话。查看进程组 ID 、会话 ID 前后变化

【 session.c 】

2守护进程

Daemon(精灵)进程，是 Linux 中的后台服务进程，通常独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。一般采用以 d 结尾的名字。Linux 后台的一些系统服务进程，没有控制终端，不能直接和用户交互。不受用户登录、注销的影响，一直在运行着，他们都是守护进程。如：预读入缓输出机制的实现；ftp 服务器；nfs 服务器等。创建守护进程，最关键的一步是调用 setsid 函数创建一个新的 Session，并成为 Session Leader。

2.1 创建守护进程模型

1. 创建子进程，父进程退出

所有工作在子进程中进行形式上脱离了控制终端

2. 在子进程中创建新会话

setsid()函数

使子进程完全独立出来，脱离控制

3. 改变当前目录位置

chdir()函数

防止占用可卸载的文件系统

也可以换成其它路径

4. 重设文件权限掩码

umask()函数

防止继承的文件创建屏蔽字拒绝某些权限

增加守护进程灵活性

5. 关闭文件描述符

继承的打开文件不会用到，浪费系统资源，无法卸载

6. 开始执行守护进程核心工作守护进程退出处理程序模型

3 线程概念

3.1 什么是线程

LWP ： light weight process 轻量级的进程，本质仍是进程 ( 在 Linux 环境下 )

进程：独立地址空间，拥有 PCB

线程：有独立的 PCB ，但没有独立的地址空间 ( 共享 )

区别：在于是否共享地址空间。

独居 ( 进程 ) ；合租 ( 线程 ) 。

Linux 下：

线程：最小的执行单位

进程：最小分配资源单位，可看成是只有一个线程的进程。

3.2 Linux 内核线程实现原理

类 Unix 系统中，早期是没有“线程”概念的， 80 年代才引入，借助进程机制实现出了线程的概念。因此在这类系统中，进程和线程关系密切。

1. 轻量级进程 (light-weight process) ，也有 PCB ，创建线程使用的底层函数和进程一样，都是 clone

2. 从内核里看进程和线程是一样的，都有各自不同的 PCB ，但是 PCB 中指向内存资源的三级页表是相同的

3. 进程可以蜕变成线程

4. 线程可看做寄存器和栈的集合

5. 在 linux 下，线程最是小的执行单位；进程是最小的分配资源单位察看 LWP 号： ps –Lf pid 查看指定线程的 lwp 号。

三级映射：进程 PCB --> 页目录 ( 可看成数组，首地址位于 PCB 中 ) --> 页表 --> 物理页面 --> 内存单元

参考：《 Linux 内核源代码情景分析》 ---- 毛德操

对于进程来说，相同的地址 ( 同一个虚拟地址 ) 在不同的进程中，反复使用而不冲突。原因是他们虽虚拟址一样，但，页目录、页表、物理页面各不相同。相同的虚拟址，映射到不同的物理页面内存单元，最终访问不同的物理页面。但！线程不同！两个线程具有各自独立的 PCB，但共享同一个页目录，也就共享同一个页表和物理页面。所以两个 PCB 共享一个地址空间。实际上，无论是创建进程的 fork ，还是创建线程的 pthread_create ，底层实现都是调用同一个内核函数 clone 。如果复制对方的地址空间，那么就产出一个“进程”；如果共享对方的地址空间，就产生一个“线程”。因此：Linux 内核是不区分进程和线程的。只在用户层面上进行区分。所以，线程所有操作函数 pthread_* 是库函数，而非系统调用。

3.3 线程共享资源

1. 文件描述符表

2. 每种信号的处理方式

3. 当前工作目录

4. 用户 ID 和组 ID

5. 内存地址空间 (.text/.data/.bss/heap/ 共享库 )

3.4 线程非共享资源

1. 线程 id

2. 处理器现场和栈指针 ( 内核栈 )

3. 独立的栈空间 ( 用户空间栈 )

4.errno 变量

5. 信号屏蔽字

6. 调度优先级

3.5 线程优、缺点

优点：

1. 提高程序并发性

2. 开销小

3. 数据通信、共享数据方便

缺点： 1. 库函数，不稳定

2. 调试、编写困难、 gdb 不支持

3. 对信号支持不好

优点相对突出，缺点均不是硬伤。 Linux 下由于实现方法导致进程、线程差别不是很大。

3.6 线程控制原语

3.6.1 pthread_self 函数

获取线程 ID 。其作用对应进程中 getpid() 函数。pthread_t pthread_self(void);返回值：成功： 0 ；

失败：无！

线程 ID ： pthread_t 类型，本质：在 Linux 下为无符号整数 (%lu) ，其他系统中可能是结构体实现

线程 ID 是进程内部，识别标志。 ( 两个进程间，线程 ID 允许相同 ) 注意：不应使用全局变量 pthread_t tid ，在子线程中通过 pthread_create 传出参数来获取线程 ID ，而应使用pthread_self。

3.6.2 pthread_create 函数

创建一个新线程。

其作用，对应进程中 fork() 函数。

int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);

返回值：成功： 0 ；

失败：错误号

-----Linux 环境下，所有线程特点，失败均直接返回错误号。

参数：

pthread_t ：当前 Linux 中可理解为： typedef unsigned long int pthread_t;

参数 1 ：传出参数，保存系统为我们分配好的线程 ID

参数 2 ：通常传 NULL ，表示使用线程默认属性。若想使用具体属性也可以修改该参数。

参数 3 ：函数指针，指向线程主函数 ( 线程体 ) ，该函数运行结束，则线程结束。

参数 4 ：线程主函数执行期间所使用的参数。

在一个线程中调用 pthread_create() 创建新的线程后，当前线程从 pthread_create() 返回继续往下执行，而新的线程所执行的代码由我们传给 pthread_create 的函数指针 start_routine 决定。 start_routine 函数接收一个参数，是通过pthread_create 的 arg 参数传递给它的，该参数的类型为 void * ，这个指针按什么类型解释由调用者自己定义。start_routine 的返回值类型也是 void * ，这个指针的含义同样由调用者自己定义。 start_routine 返回时，这个线程就退出了，其它线程可以调用 pthread_join 得到 start_routine 的返回值，类似于父进程调用 wait(2) 得到子进程的退出状态，稍后详细介绍 pthread_join 。 pthread_create 成功返回后，新创建的线程的 id 被填写到 thread 参数所指向的内存单元。我们知道进程 id 的类型是 pid_t ，每个进程的 id 在整个系统中是唯一的，调用 getpid(2) 可以获得当前进程的 id ，是一个正整数值。线程id 的类型是 thread_t ，它只在当前进程中保证是唯一的，在不同的系统中 thread_t 这个类型有不同的实现，它可能是一个整数值，也可能是一个结构体，也可能是一个地址，所以不能简单地当成整数用 printf 打印，调用 pthread_self(3) 可以获得当前线程的 id 。

attr 参数表示线程属性，本节不深入讨论线程属性，所有代码例子都传 NULL 给 attr 参数，表示线程属性取缺省值，感兴趣的读者可以参考 APUE 。、

#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <string.h>
#include <arpa/inet.h>
#include <netinet/in.h>
#include <ctype.h>
#include <pthread.h>


//线程执行函数
void *mythread(void *arg)
{
     //pid 是进程的id pthread_self() 返回自身线程的id
     printf("child thread,pid=[%d],id==[%ld]\n", getpid(), pthread_self());
     return NULL;
}

int main()
{
     //创建子线程
     //int pthread_create(pthread_t *thread, const pthread_attr_t *attr,
    //                      void *(*start_routine) (void *), void *arg);
     pthread_t thread;
     int ret = pthread_create(&thread, NULL, mythread, NULL);//成功返回0 ，否则返回null
     if (ret != 0)
     {
          printf("pthread_create error,[%s]\n", strerror(ret));
          return -1;
     }

     printf("main thread ,pid=[%d],id==[%ld]\n", getpid(), pthread_self());

     //目的是让子线程可以执行a起立，否则x子线程没法执行。
     sleep(1);

     return 0;
}

【练习】：创建一个新线程，打印线程 ID 。注意：链接线程库 -lpthread

由于 pthread_create 的错误码不保存在 errno 中，因此不能直接用 perror(3) 打印错误信息，可以先用 strerror(3)把错误码转换成错误信息再打印。如果任意一个线程调用了 exit 或 _exit ，则整个进程的所有线程都终止，由于从main 函数 return 也相当于调用 exit ，为了防止新创建的线程还没有得到执行就终止，我们在 main 函数 return 之前延时 1 秒，这只是一种权宜之计，即使主线程等待 1 秒，内核也不一定会调度新创建的线程执行，下一节我们会看到更好的办法。

【练习】：循环创建多个线程，每个线程打印自己是第几个被创建的线程。 ( 类似于进程循环创建子进程 )

【 more_pthrd.c 】

拓展思考：将 pthread_create 函数参 4 修改为 (void *)&i, 将线程主函数内改为 i=*((int *)arg) 是否可以？

3.7 线程与共享

线程间共享全局变量！

【牢记】：线程默认共享数据段、代码段等地址空间，常用的是全局变量。而进程不共享全局变量，只能借助 mmap 。

【练习】：设计程序，验证线程之间共享全局数据。

【 glb_var_pthrd.c 】

3.8 pthread_exit 函数

将单个线程退出

void pthread_exit(void *retval);

参数： retval 表示线程退出状态，通常传 NULL

思考：使用 exit 将指定线程退出，可以吗？

【 pthrd_exit.c 】

结论：线程中，禁止使用 exit 函数，会导致进程内所有线程全部退出。在不添加 sleep 控制输出顺序的情况下。 pthread_create 在循环中，几乎瞬间创建 5 个线程，但只有第 1 个线程有机会输出（或者第 2 个也有，也可能没有，取决于内核调度）如果第 3 个线程执行了 exit ，将整个进程退出了，所以全部线程退出了。所以，多线程环境中，应尽量少用，或者不使用 exit 函数，取而代之使用 pthread_exit 函数，将单个线程退出。任何线程里 exit 导致进程退出，其他线程未工作结束，主控线程退出时不能 return 或 exit 。另注意，pthread_exit 或者 return 返回的指针所指向的内存单元必须是全局的或者是用 malloc 分配的，不能在线程函数的栈上分配，因为当其它线程得到这个返回指针时线程函数已经退出了。

【练习】：编写多线程程序，总结 exit 、 return 、 pthread_exit 各自退出效果。

return ：返回到调用者那里去。

pthread_exit() ：将调用该函数的线程退出

exit: 将进程退出

3.9 pthread_join 函数

阻塞等待线程退出，获取线程退出状态

其作用，对应进程中 waitpid() 函数。

int pthread_join(pthread_t thread, void **retval); 成功： 0 ；失败：错误号

参数： thread ：线程 ID （【注意】：不是指针）； retval ：存储线程结束状态。

对比记忆：

进程中： main 返回值、 exit 参数 -->int ；等待子进程结束 wait 函数参数 -->int *

线程中：线程主函数返回值、 pthread_exit-->void * ；等待线程结束 pthread_join 函数参数 -->void **

【练习】：参数 retval 非空用法。

【 pthrd_exit_join.c 】

调用该函数的线程将挂起等待，直到 id 为 thread 的线程终止。 thread 线程以不同的方法终止，通过 pthread_join

得到的终止状态是不同的，总结如下：

1. 如果 thread 线程通过 return 返回， retval 所指向的单元里存放的是 thread 线程函数的返回值。

2. 如果 thread 线程被别的线程调用 pthread_cancel 异常终止掉， retval 所指向的单元里存放的是常数 PTHREAD_CANCELED。

3. 如果 thread 线程是自己调用 pthread_exit 终止的， retval 所指向的单元存放的是传给 pthread_exit 的参数。

4. 如果对 thread 线程的终止状态不感兴趣，可以传 NULL 给 retval 参数。

【练习】：使用 pthread_join 函数将循环创建的多个子线程回收。

【 pthrd_loop_join.c 】

3.10 pthread_detach 函数

实现线程分离

int pthread_detach(pthread_t thread); 成功： 0 ；失败：错误号

线程分离状态：指定该状态，线程主动与主控线程断开关系。线程结束后，其退出状态不由其他线程获取，而

直接自己自动释放。网络、多线程服务器常用。

进程若有该机制，将不会产生僵尸进程。僵尸进程的产生主要由于进程死后，大部分资源被释放，一点残留资

源仍存于系统中，导致内核认为该进程仍存在。

也可使用 pthread_create 函数参 2( 线程属性 ) 来设置线程分离。

【练习】：使用 pthread_detach 函数实现线程分离

【 pthrd_detach.c 】

一般情况下，线程终止后，其终止状态一直保留到其它线程调用 pthread_join 获取它的状态为止。但是线程也

可以被置为 detach 状态， 这样的线程一旦终止就立刻回收它占用的所有资源，而不保留终止状态。

不能对一个已经处于 detach 状态的线程调用 pthread_join ，这样的调用将返回 EINVAL 错误。也就是说，如果已

经对一个线程调用了 pthread_detach 就不能再调用 pthread_join 了。

3.11 pthread_cancel 函数

杀死 ( 取消 ) 线程

其作用，对应进程中 kill() 函数。

int pthread_cancel(pthread_t thread); 成功： 0 ；失败：错误号

【注意】：线程的取消并不是实时的，而有一定的延时。需要等待线程到达某个取消点 ( 检查点 ) 。

类似于玩游戏存档，必须到达指定的场所 ( 存档点，如：客栈、仓库、城里等 ) 才能存储进度。杀死线程也不是。立刻就能完成，必须要到达取消点。取消点：是线程检查是否被取消，并按请求进行动作的一个位置。通常是一些系统调用 creat ， open ， pause ，close， read ， write..... 执行命令 man 7 pthreads 可以查看具备这些取消点的系统调用列表。也可参阅 APUE.12.7 取消选项小节。可粗略认为一个系统调用(进入内核 ) 即为一个取消点。如线程中没有取消点，可以通过调用 pthread_testcancel 函数自行设置一个取消点。被取消的线程，退出值定义在Linux的 pthread 库中。常数 PTHREAD_CANCELED 的值是 -1 。可在头文件 pthread.h中找到它的定义：#define PTHREAD_CANCELED ((void *) -1) 。因此当我们对一个已经被取消的线程使用 pthread_join回收时，得到的返回值为-1 。

【练习】：终止线程的三种方法。注意“取消点”的概念。

【 pthrd_endof3.c 】

3.12 终止线程方式

总结：终止某个线程而不终止整个进程，有三种方法：

1. 从线程主函数 return 。这种方法对主控线程不适用，从 main 函数 return 相当于调用 exit 。

2. 一个线程可以调用 pthread_cancel 终止同一进程中的另一个线程。

3. 线程可以调用 pthread_exit 终止自己。

3.13 控制原语对比

进程

线程

fork

pthread_create

exit

pthread_exit

wait

pthread_join

kill

pthread_cancel

getpid

pthread_self

命名空间

3.14 线程属性

本节作为指引性介绍， linux 下线程的属性是可以根据实际项目需要，进行设置，之前我们讨论的线程都是采用线程的默认属性，默认属性已经可以解决绝大多数开发时遇到的问题。如我们对程序的性能提出更高的要求那么需要设置线程属性，比如可以通过设置线程栈的大小来降低内存的使用，增加最大线程个数。

typedef struct

{

int

etachstate; // 线程的分离状态

int

schedpolicy; // 线程调度策略

struct sched_param

schedparam; // 线程的调度参数

int

inheritsched; // 线程的继承性

int

scope;

// 线程的作用域

size_t

guardsize;

// 线程栈末尾的警戒缓冲区大小

int

stackaddr_set; // 线程的栈设置

void*

stackaddr;

// 线程栈的位置

size_t

stacksize;

// 线程栈的大小

} pthread_attr_t;

主要结构体成员：

1. 线程分离状态

2. 线程栈大小（默认平均分配）

3. 线程栈警戒缓冲区大小（位于栈末尾）

参 APUE.12.3 线程属性属性值不能直接设置，须使用相关函数进行操作，初始化的函数为 pthread_attr_init ，这个函数必须在pthread_create 函数之前调用。之后须用 pthread_attr_destroy 函数来释放资源。线程属性主要包括如下属性：作用域（scope ）、栈尺寸（ stack size ）、栈地址（ stack address ）、优先级（ priority ）、分离的状态（detached state ）、调度策略和参数（ scheduling policy and parameters ）。默认的属性为非绑定、非分离、缺省的堆栈、与父进程同样级别的优先级。

3.15 线程属性初始化

注意：应先初始化线程属性，再 pthread_create 创建线程

初始化线程属性

int pthread_attr_init(pthread_attr_t *attr); 成功： 0 ；失败：错误号

销毁线程属性所占用的资源

int pthread_attr_destroy(pthread_attr_t *attr); 成功： 0 ；失败：错误号

3.16 线程的分离状态

线程的分离状态决定一个线程以什么样的方式来终止自己。

非分离状态：线程的默认属性是非分离状态，这种情况下，原有的线程等待创建的线程结束。只有当 pthread_join()

函数返回时，创建的线程才算终止，才能释放自己占用的系统资源。

分离状态：分离线程没有被其他的线程所等待，自己运行结束了，线程也就终止了，马上释放系统资源。应该

根据自己的需要，选择适当的分离状态。

线程分离状态的函数：

设置线程属性，分离 or 非分离

int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate);

获取程属性，分离 or 非分离

int pthread_attr_getdetachstate(pthread_attr_t *attr, int *detachstate);

参数： attr ：已初始化的线程属性

detachstate ： PTHREAD_CREATE_DETACHED （分离线程）

PTHREAD _CREATE_JOINABLE （非分离线程）

这里要注意的一点是，如果设置一个线程为分离线程，而这个线程运行又非常快，它很可能在 pthread_create

函数返回之前就终止了，它终止以后就可能将线程号和系统资源移交给其他的线程使用，这样调用 pthread_create

的线程就得到了错误的线程号。要避免这种情况可以采取一定的同步措施，最简单的方法之一是可以在被创建的线

程里调用 pthread_cond_timedwait 函数，让这个线程等待一会儿，留出足够的时间让函数 pthread_create 返回。设

置一段等待时间，是在多线程编程里常用的方法。但是注意不要使用诸如 wait() 之类的函数，它们是使整个进程睡

眠，并不能解决线程同步的问题。

线程属性控制示例

#include <pthread.h>

#define SIZE 0x100000

void *th_fun(void *arg)

{

while (1)

sleep(1);

}

int main(void)

{

pthread_t tid;

int err, detachstate, i = 1;

pthread_attr_t attr;

size_t stacksize;

void *stackaddr;

pthread_attr_init(&attr);

pthread_attr_getstack(&attr, &stackaddr, &stacksize);

pthread_attr_getdetachstate(&attr, &detachstate);

if (detachstate == PTHREAD_CREATE_DETACHED)

printf("thread detached\n");

else if (detachstate == PTHREAD_CREATE_JOINABLE)

printf("thread join\n");

else

printf("thread unknown\n");

pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);

while (1) {

stackaddr = malloc(SIZE);

if (stackaddr == NULL) {

perror("malloc");

exit(1);

}

stacksize = SIZE;

pthread_attr_setstack(&attr, stackaddr, stacksize);

err = pthread_create(&tid, &attr, th_fun, NULL);

if (err != 0) {

printf("%s\n", strerror(err));

exit(1);

}

printf("%d\n", i++);

}

pthread_attr_destroy(&attr);

return 0;

}