Linux--守护进程和线程

最新推荐文章于 2024-07-23 19:15:06 发布

使劲搬砖

最新推荐文章于 2024-07-23 19:15:06 发布

阅读量307

点赞数 1

文章标签： linux

本文链接：https://blog.csdn.net/m0_65993150/article/details/132307213

版权

1 守护进程

1.1 守护进程介绍

Daemon(精灵)进程，是Linux中的后台服务进程，通常独立于控制终端并且周期性地执行某种任务或等待处理某些发生的事件。一般采用以d结尾的名字，如vsftpd

Linux后台的一些系统服务进程，没有控制终端，不能直接和用户交互。不受用户登录、注销的影响，一直在运行着，他们都是守护进程。如：预读入缓输出机制的实现；ftp服务器；nfs服务器等。

总结守护进程的特点：

Linux后台服务进程
独立于控制终端
周期性的执行某种任务
不受用户登陆和注销的影响
一般采用以d结尾的名字

1.2 进程组和会话

进程组

进程组是一个或者多个进程的集合，每个进程都属于一个进程组，引入进程组是为了简化对进程的管理。当父进程创建子进程的时候，默认子进程与父进程属于同一个进程组。

进程组ID==第一个进程ID（组长进程）。如父进程创建了多个子进程，父进程和多个子进程同属于一个组，而由于父进程是进程组里的第一个进程，所以父进程就是这个组的组长, 组长ID==父进程ID。

可以使用kill -SIGKILL -进程组ID(负的)来将整个进程组内的进程全部杀死。
只要进程组中有一个进程存在，进程组就存在，与组长进程是否终止无关。
进程组生存期：从进程组创建到最后一个进程离开

会话

一个会话是一个或多个进程组的集合。
创建会话的进程不能是进程组组长
创建会话的进程成为一个进程组的组长进程，同时也成为会话的会长。
需要有root权限（ubuntu不需要）
新创建的会话丢弃原有的控制终端
建立新会话时，先调用fork, 父进程终止，子进程调用setsid函数

可以使用ps ajx来查看进程组ID和会话ID

可以fork出几个子进程，然后查看进程组ID和会话ID

进程组和会话的关系图

1.3 创建守护进程的模型

第1步：fork子进程，父进程退出

子进程继承了父进程的进程组ID, 但具有一个新的进程ID,这样就保证了子进程不是一个进程组的组长ID,这对于下面要做的setsid函数的调用是必要的前提条件

第2步：子进程调用setsid函数创建新会话

调用这个函数以后

该进程成为新会话的首进程，是会话的会长
成为一个新进程组的组长进程，是进程组组长
不受控制终端的影响

第3步：改变当前工作目录chdir

如：a.out在U盘上，启动这个程序，这个程序的当前的工作目录就是这个u盘，如果u盘拔掉后进程的当前工作目录将消失，a.out将不能正常工作。

第4步：重设文件掩码 mode & ~umask

子进程会继承父进程的掩码
增加子进程程序操作的灵活性
umask(0000);

第5步：关闭文件描述符

守护进程不受控制终端的影响所以可以关闭，以释放资源
close(STDIN_FILENO);

close(STDOUT_FILENO);

close(STDERR_FILENO);

第6步：执行核心工作

守护进程的核心代码逻辑

2.线程

2.1 什么是线程

轻量级的进程（LWP：light weight process），在Linux环境下线程的本质仍是进程。
进程：拥有独立的地址空间，拥有PCB，相当于独居。
线程：有PCB，但没有独立的地址空间，多个线程共享进程空间，相当于合租。

在Linux操作系统下：

线程：最小的执行单位
进程：最小分配资源单位，可看成是只有一个线程的进程。

线程的特点

类Unix系统中，早期是没有“线程”概念的，80年代才引入，借助进程机制实现出了线程的概念。因此在这类系统中，进程和线程关系密切。

线程是轻量级进程(light-weight process)，也有PCB，创建线程使用的底层函数和进程一样，都是clone
从内核里看进程和线程是一样的，都有各自不同的PCB.
进程可以蜕变成线程

在linux下，线程最是小的执行单位；进程是最小的分配资源单位

Ø 察看指定线程的LWP号：ps –Lf pid

实际上，无论是创建进程的fork，还是创建线程的pthread_create，底层实现都是调用同一个内核函数 clone。

如果复制对方的地址空间，那么就产出一个“进程”；
如果共享对方的地址空间，就产生一个“线程”。

so：Linux内核是不区分进程和线程的, 只在用户层面上进行区分。

所以，线程所有操作函数 pthread_* 是库函数，而非系统调用。

2.2 线程共享资源

文件描述符表
每种信号的处理方式
当前工作目录
用户ID和组ID
内存地址空间 (.text/.data/.bss/heap/共享库)

2.3 线程非共享资源

线程id
处理器现场和栈指针(内核栈)
独立的栈空间(用户空间栈)
errno变量
信号屏蔽字
调度优先级

2.4 线程优、缺点

优点：
- 提高程序并发性
- 开销小
- 数据通信、共享数据方便
缺点：
- 库函数，不稳定
- gdb调试、编写困难
- 对信号支持不好

优点相对突出，缺点均不是硬伤。Linux下由于实现方法导致进程、线程差别不是很大。

2.5 pthread_create函数

函数作用：

创建一个新线程

函数原型

int pthread_create(pthread_t *thread,

const pthread_attr_t *attr,

void *(*start_routine) (void *),

void *arg);

返回值

成功，返回0
失败，返回错误号

函数参数：

pthread_t：传出参数，保存系统为我们分配好的线程ID

当前Linux中可理解为：typedef unsigned long int pthread_t。

attr：通常传NULL，表示使用线程默认属性。若想使用具体属性也可以修改该参数。
start_routine：函数指针，指向线程主函数(线程体)，该函数运行结束，则线程结束。
arg：线程主函数执行期间所使用的参数。

注意点

由于pthread_create的错误码不保存在errno中，因此不能直接用perror()打印错误信息，可以先用strerror()把错误码转换成错误信息再打印。
如果任意一个线程调用了exit或_exit，则整个进程的所有线程都终止，由于从main函数return也相当于调用exit，为了防止新创建的线程还没有得到执行就终止，我们在main函数return之前延时1秒，这只是一种权宜之计，即使主线程等待1秒，内核也不一定会调度新创建的线程执行，下一节我们会看到更好的办法。

2.6 pthread_exit函数

在线程中禁止调用exit函数，否则会导致整个进程退出，取而代之的是调用pthread_exit函数，这个函数是使一个线程退出，如果主线程调用pthread_exit函数也不会使整个进程退出，不影响其他线程的执行。

函数描述

将单个线程退出

函数原型

void pthread_exit(void *retval);

函数参数

retval表示线程退出状态，通常传NULL

另注意，pthread_exit或者return返回的指针所指向的内存单元必须是全局的或者是用malloc分配的，不能在线程函数的栈上分配，因为当其它线程得到这个返回指针时线程函数已经退出了，栈空间就会被回收。

2.7 pthread_join函数

函数描述：阻塞等待线程退出，获取线程退出状态。其作用，对应进程中的waitpid() 函数。
函数原型：int pthread_join(pthread_t thread, void **retval);
函数返回值：

成功：0；
失败：错误号

函数参数：

thread：线程ID
retval：存储线程结束状态，整个指针和pthread_exit的参数是同一块内存地址。

2.8 pthread_detach函数

线程分离状态：指定该状态，线程主动与主控线程断开关系。线程结束后，其退出状态不由其他线程获取，而直接自己自动释放。网络、多线程服务器常用。

进程若有该机制，将不会产生僵尸进程。僵尸进程的产生主要由于进程死后，大部分资源被释放，一点残留资源仍存于系统中，导致内核认为该进程仍存在。

也可使用 pthread_create函数参2(线程属性)来设置线程分离。pthread_detach函数是在创建线程之后调用的。

函数描述

实现线程分离

函数原型

int pthread_detach(pthread_t thread);

函数返回值

成功：0；
失败：错误号

一般情况下，线程终止后，其终止状态一直保留到其它线程调用pthread_join获取它的状态为止。但是线程也可以被置为detach状态，这样的线程一旦终止就立刻回收它占用的所有资源，而不保留终止状态。不能对一个已经处于detach状态的线程调用pthread_join，这样的调用将返回EINVAL错误。也就是说，如果已经对一个线程调用了pthread_detach就不能再调用pthread_join了。

2.9 pthread_cancel函数

函数描述

杀死(取消)线程。其作用，对应进程中 kill() 函数。

函数原型

int pthread_cancel(pthread_t thread);

函数返回值

成功：0；
失败：错误号

【注意】：线程的取消并不是实时的，而有一定的延时。需要等待线程到达某个取消点(检查点)。

类似于玩游戏存档，必须到达指定的场所(存档点，如：客栈、仓库、城里等)才能存储进度。杀死线程也不是立刻就能完成，必须要到达取消点。

取消点：是线程检查是否被取消，并按请求进行动作的一个位置。通常是一些系统调用creat，open，pause，close，read，write..... 执行命令man 7 pthreads可以查看具备这些取消点的系统调用列表。可粗略认为一个系统调用(进入内核)即为一个取消点。还以通过调用pthread_testcancel函数设置一个取消点。

函数原型：void pthread_testcancel(void);

2.10 pthread_equal函数

函数描述：

比较两个线程ID是否相等。

函数原型

int pthread_equal(pthread_t t1, pthread_t t2);

注意：这个函数是为了以能够扩展使用的，有可能Linux在未来线程ID pthread_t 类型被修改为结构体实现。

2.11 进程函数和线程函数比较

进程	线程
fork	pthread_create
exit	pthread_exit
wait/waitpid	pthread_join
kill	pthread_cancel
getpid	pthread_self

3.线程属性

linux下线程的属性是可以根据实际项目需要，进行设置，之前讨论的线程都是采用线程的默认属性，默认属性已经可以解决绝大多数开发时遇到的问题，如果对程序的性能提出更高的要求，则需要设置线程属性，本节以设置线程的分离属性为例讲解设置线程属性。

线程的分离状态决定一个线程以什么样的方式来终止自己，有两种状态：

非分离状态：线程的默认属性是非分离状态，这种情况下，原有的线程等待创建的线程结束。只有当pthread_join()函数返回时，创建的线程才算终止，才能释放自己占用的系统资源。
分离状态：分离线程没有被其他的线程所等待，自己运行结束了，线程也就终止了，马上释放系统资源。应该根据自己的需要，选择适当的分离状态。

设置线程属性分为以下步骤

第1步：定义线程属性类型类型的变量

pthread_attr_t attr;

第2步：对线程属性变量进行初始化

int pthread_attr_init (pthread_attr_t* attr);

第3步：设置线程为分离属性

int pthread_attr_setdetachstate(

pthread_attr_t *attr,

int detachstate);

参数:

attr: 线程属性
detachstate:

PTHREAD_CREATE_DETACHED(分离)
PTHREAD_CREATE_JOINABLE（非分离)

注意：这一步完成之后调用pthread_create函数创建线程，

则创建出来的线程就是分离线程；其实上述三步就是

pthread_create的第二个参数做准备工作。

第4步：释放线程属性资源

int pthread_attr_destroy(pthread_attr_t *attr);

参数：线程属性

4.线程同步

4.1 线程同步的概念

线程同步，指一个线程发出某一功能调用时，在没有得到结果之前，该调用不返回。同时其它线程为保证数据一致性，不能调用该功能。

4.2 线程同步的例子

创建两个线程，让两个线程共享一个全局变量int number，然后让每个线程数5000次数，看最后打印出这个number值是多少？

线程A代码片段：

线程B代码片段：

代码片段说明

代码中使用调用usleep是为了让两个子线程能够轮流使用CPU，避免一个子线程在一个时间片内完成5000次数数。
对number执行++操作，使用了中间变量cur是为了尽可能的模拟cpu时间片用完而让出cpu的情况。

测试结果

经过多次测试最后的结果显示，有可能会出现number值少于5000*2=10000的情况。

分析原因

假如子线程A执行完了cur++操作，还没有将cur的值赋值给number失去了cpu的执行权，子线程B得到了cpu执行权，而子线程B最后执行完了number=cur，而后失去了cpu的执行权；此时子线程A又重新得到cpu的执行权，并执行number=cur操作，这样会把线程B刚刚写回number的值被覆盖了，造成number值不符合预期的值。