先自我介绍一下,小编浙江大学毕业,去过华为、字节跳动等大厂,目前阿里P7
深知大多数程序员,想要提升技能,往往是自己摸索成长,但自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年最新大数据全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
如果你需要这些资料,可以添加V获取:vip204888 (备注大数据)
正文
- waitpid
返回值:正常返回的时候waitpid返回收集到的子进程的进程ID ,如果调用中出错,则返回-1,这时errno会被设置成相应的值以指示错误所在
参数:Pid=-1,等待任一个子进程。与wait等效。Pid>0.等待其进程ID与pid相等的子进程
status:wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充 ,如果传递NULL,表示不关心子进程的退出状态信息。否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。status不能简单的当作整形来看待,可以当作位图来看待
次低8位:退出状态((>>8)&0xFF)。低7位:终止信号(&0x7F)。若pid指定的子进程没有结束,则waitpid()函数返回0,不予以等待。若正常结束,则返回该子进程的ID
对应的错误:
僵尸进程退出的时候对应信息放在哪:
子进程和父进程有对应的pcb信息,父进程调用waitpid,子进程退出的时候把对应的代码和信号保存起来,保存到PCB。而waitpid是系统调用,以操作系统身份执行代码,找到子进程,把传入的status传入子进程里面,把代码和退出信号设置进status,设置完毕之后把值输入status。也就是说,等待的本质是检测子进程退出信息,将子进程退出信息通过status拿回来。所以最终看到了status的结果
我们可以来看一看tash_struct,找到退出码和退出信息:
总结来说,子进程退出变成僵尸,会把自己的退出的结果写入自己的task_struct,wait/waitpid是一个系统调用,OS有能力去读取子进程的task_struct。
对此,我们对于wait和waitpid有了初步的了解。
但是,对于获得子进程的退出结果,我们可以不采用位操作进行,Linux提供了对应操作的宏
WIFEXITED(status): 若为正常终止子进程返回的状态,则为真。(查看进程是否是正常退出)
WEXITSTATUS(status): 若WIFEXITED非零,提取子进程退出码。(查看进程的退出码)
int main()
{
pid\_t id = fork();
assert(id!=-1);
if(id==0)
{
int cnt = 50;
while(cnt)
{
printf("这是子进程pid:%d,ppid:%d,cnt:%d\n",getpid(),getppid(),cnt--);
sleep(1);
}
exit(10);
}
int status = 0;
int ret = waitpid(id,&status,0);
if(ret>0)
{
//判断是否正常退出
if(WIFEXITED(status))
{
//判断结果
printf("exit code:%d\n",WEXITSTATUS(status));
}
else{
printf("child exit:not normal!\n");
}
}
// printf("wait success,exit code:%d,sig:%d\n",(status>>8)&0xFF,status & 0x7F);
return 0;
}
五、进程的阻塞与非阻塞
阻塞等待(0):父进程调用wait/waitpid等子进程时,直到子进程退出,这是阻塞时等待
非阻塞等待(WNOHANG):检测状态,如果没有就绪父进程检测之后立即返回。每一次非阻塞等待都是一次,多次非阻塞等待称为轮询的过程。
我们看一看非阻塞等待的代码实现:
非阻塞不会占用父进程的精力,可以在轮询期间,让父进程干别的事情,这里可以简单举个例子就能明白:
#include <stdio.h>
#include <unistd.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
#include <assert.h>
#include <stdlib.h>
#define NUM 10
typedef void (\*func\_t)();
func\_t handlerTask[NUM];
void task1()
{
printf("handler task1\n");
}
void task2()
{
printf("handler task2\n");
}
void task3()
{
printf("handler task3\n");
}
void loadTask()
{
memset(handlerTask, 0, sizeof(handlerTask));
handlerTask[0] = task1;
handlerTask[1] = task2;
handlerTask[2] = task3;
}
int main()
{
pid\_t id = fork();
assert(id != -1);
if (id == 0)
{
int cnt = 10;
while (cnt)
{
printf("这是子进程pid:%d,ppid:%d,cnt:%d\n", getpid(), getppid(), cnt--);
sleep(3);
}
exit(10);
}
loadTask();
int status = 0;
while (1)
{
pid\_t ret = waitpid(id, &status, WNOHANG);
//WNOHANG:非阻塞:子进程没有退出,父进程检测之后立即退出
if (ret == 0)
{
//waitpid调用成功&&子进程没退出
//子进程没有退出,我的waitpid没有等待失败,仅仅检测到而来子进程没有退出
printf("wait done,but child is running...parent running other things\n");
for (int i = 0; handlerTask[i] != NULL; i++)
{
handlerTask[i]();//回调
}
}
else if (ret > 0)
{
//waitpid调用成功&&子进程退出
printf("wait success,exit code:%d,sig:%d\n", (status >> 8) & 0xFF, status & 0x7F);
break;
}
else
{
//waitpid调用失败
printf("waitpid call failed\n");
break;
}
sleep(1);
}
return 0;
}
五、进程程序替换
我们知道:创建子进程可以1.让子进程执行父进程代码的一部分2.让子进程执行一个全新的程序
我们先来看一看替换函数
#include <unistd.h>`
int execl(const char *path, const char *arg, ...);//...是可变参数列表
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ...,char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
废话不多说,先来单独见一见用法,我们以execl为例子:
对于替换函数,我们需要注意到:execl系列的函数结尾以NULL结尾
同时,这里为什么第二个printf输出语句没有执行?
替换原理
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数
以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动
例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变
**简单来说程序替换的本质就是将指定程序的代码和数据加载到指定的位置,覆盖自己的代码和数据。进程替换的时候并没有创建新的进程。**printf也是代码,在exec之后,exec执行完毕之后代码已经全部被覆盖,开始执行新的代码,所以第二个printf就无法执行了。
对于返回值问题:
这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回,和接下去的代码无关了。如果调用出错则返回-1,所以exec函数只有出错的返回值而没有成功的返回值。
到了这,我们可以通过创建进程的方式结合替换函数来看看:
因为进程具有独立性,所以这里的替换并不会影响父进程。通过虚拟地址空间以及页表保证进程独立性,一旦执行流想替换代码或者数据就会发生写时拷贝。
同时,对于其他替换函数,如何记住用法:
l(list) : 表示参数采用列表
v(vector) : 参数用数组,将所有的执行参数,传入数组中,统一传递不用使用可变参数
p(path) : 有p自动搜索环境变量PATH
e(env) : 表示自己维护环境变量
- execlp
- execv
- execvp
- execle
这里的系统的环境变量是null,这其实很好理解,被调起来的程序获得了环境变量,这也说明了环境变量具有全局性。如何同时获得系统的环境变量?putenv
前面这些都是执行系统命令,如何执行自己写的程序:
注意:进程执行的时候,execl先执行,main后执行。execl系列函数将程序加载到内存中,所以Linux的execl接口是加载器,所以是先加载后执行,main也是函数也要被调用,通过execl/系统传参给main
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
91ef3706ab2.png)
注意:进程执行的时候,execl先执行,main后执行。execl系列函数将程序加载到内存中,所以Linux的execl接口是加载器,所以是先加载后执行,main也是函数也要被调用,通过execl/系统传参给main
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
需要这份系统化的资料的朋友,可以添加V获取:vip204888 (备注大数据)
[外链图片转存中…(img-TecqlUvr-1713346711673)]
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!