fork入门

1哪个分支会打印

如下是fork的典型问题。fork之后有3个分支,分别是pid等于0,pid大于0,pid小于0。如果我们不了解fork的话,那么肯定会认为这里的if else分支只会有一个分支被执行。而实际的执行结果是两个分支都执行了。fork返回之后就创建了一个子进程,父进程在fork返回之后继续向下执行;子进程同样也是从fork返回之后开始执行。对于父进程来说,返回值是子进程的进程号,对于子进程来说,返回值是0。

fork创建一个进程,就类似于孕妈妈生孩子。将孕妈妈推进产房的时候是一个人,从产房出来的时候是两个人。孩子刚出生的时候共享父母的资源,比如房子,金钱等,fork创建的子进程也是共享着父进程的资源。

fork类似于产房,调用fork就相当于将孕妈妈推进了产房,父进程类似于孕妈妈,子进程类似于刚出生的孩子。

fork过程和现实世界有着高度的相似性。

#include <sys/types.h>
#include <unistd.h>

int main() {
  pid_t pid = fork();
  if (pid == 0) {
    printf("pid is 0\n");
  } else if (pid > 0) {
    printf("pid > 0\n");
  } else {
    printf("pid < 0\n");
  }
  return 0;
}

2fork和pthread_create的区别

fork是创建一个新的进程,pthread_create是创建一个新的线程。直观来看,两者的区别是显而易见的。

进程和线程的区别:

进程是资源封装的单位,线程是调度的单位。进程的资源包括内存、打开的文件、信号等。以内存为例,之所以说进程是资源封装的单位,分配给一个进程的内存,只有这个进程是可以访问的,这个进程内的所有线程都共享进程的内存资源,而一个进程的内存,其它进程是不能访问的。

进程的资源:

进程号pid在一个进程内,不管在哪个线程中调用getpid,返回的pid都是一样的,都是所在的进程的进程号。
内存

①内存,最常讨论的是堆内存和栈内存,堆内存是属于进程的资源,一个进程内的所有线程共享;栈内存属于线程的资源。

②全局变量是属于进程的资源,局部变量属于线程的资源。

所以说,并不是所有的内存都是线程共享的,栈内存就是一个线程专有的。

信号处理函数当我们通过signal或sigaction注册某个信号的处理函数时,不管是在哪个线程中注册的,那么这个回调函数对于整个进程都是生效的。
打开的文件打开的文件用一个fd来表示,打开的文件属于进程的资源。

进程是资源管理的基本单位,但是在父子进程之间,两者的资源也不是完全隔离的。不同的资源有不同的处理方式:内存是写时拷贝(cow, copy on write),fork之后,父子进程之间共享内存,当内存被写时,父子进程分家;信号处理函数、打开的文件、调度策略,子进程与父进程保持一致。

fork、exec踩坑记录

在用户态来看,fork和pthread_create是完全不相干的两个api,进程和线程的区别也是很清晰。fork和pthread_create都是用户态的api,两者最终都会调用同一个系统调用clone。在linux内核中,fork创建的进程和pthread_create创建的线程都是用一个struct task_struct来表示,区别就在于资源是不是共享,不共享则创建的是进程,共享则创建的是线程。

通过实际代码和strace来查看fork和pthread对clone的调用:

如下是fork代码,使用fork创建一个子进程。

#include <stdlib.h>
#include <stdio.h>
#include <string.h>
#include <unistd.h>

int main() {
  sleep(2);

  printf("before fork\n");
  pid_t pid = fork();
  if (pid == 0) {
    for (int i = 0; i < 3; i++) {
      printf("child process, pid=%d\n", getpid());
      sleep(1);
    }
  } else if (pid > 0) {
    for (int i = 0; i < 3; i++) {
      printf("parent process, pid=%d\n", getpid());
      sleep(1);
    }
  }
  return 0;
}

如下是pthread的代码,c++中的std::thread最终也会通过pthread_create来创建一个线程。

#include <iostream>
#include <thread>
#include <unistd.h>

void func() {
}

int main() {
  sleep(2);

  std::cout << "before create thread\n";
  std::thread t(func);
  t.join();
  return 0;
}

使用 gcc fork.c -o fork和g++ thread.c -o thread分别编译上边的代码,然后使用strace来跟踪调用系统调用的情况。strace是linux的一个工具,可以打印应用调用的系统调用,同时也会打印出来形参和返回值。

如下两个截图分别显示了fork调用clone和pthread_create调用clone, 可以看到fork和pthread_create调用clone时,入参的个数和参数的内容都是不一样的。其中最主要的区别是第二个参数,pthread_create调用clone时,flag中的参数CLONE_VM,CLONE_FILES,CLONE_SIGHAND等标志,说明创建的这个线程与父线程共享这些资源。理论上来说,直接使用clone比较灵活,有多种参数的组合,但在实际项目中,没有这样的使用场景,也要尽量避免直接使用clone,使用不当很容易出错。fork和pthread_create均是用户态的api,而不是系统调用,clone才是系统调用。

fork调用clone:

pthread_create调用clone:

clone flag

clone最重要的一个形参就是flag,传入不同的flag可以决定子进程和父进程的哪些资源共享,哪些资源不共享。调用pthread_create的时候,flag中包括CLONE_VM、CLONE_FILES、CLONE_FS、CLONE_THREAD。这里的CLONE是共享的意思,而不是克隆一份全新的。

通过形参的方式来实现系统调用,这样可以使系统调用有很强的可扩展性,当需要支持不同的功能的时候,直接通过增加flag或者修改flag就可以。保证在系统调用不变的情况下,更改支持的功能,同时也能保持向下的兼容。通过man clone,也能看到clone支持很多个flag,这些flag都是在不同的linux版本中支持的。

CLONE_VM子进程和父进程共享内存,子进程修改了内存,父进程能看到;反之亦然。
CLONE_FILES

子进程和父进程共享打开的文件,也就是共享进程的fd table。比如父进程中打开了一个tcp socket,一个tcp socket就是一个打开的文件,如果设置了这个标志,那么子进程中也可以使用;如果父进程或者子进程把这个fd关闭了,那么子进程和父进程都不能使用这个fd了。

这里要区分共享和继承的区别,对于打开的文件来说,现成会共享父线程的打开的fd,共享的话是一份,两者共用一份;fork的子进程会继承父进程的打开的fd,继承的话在父子进程中各有一份,这个时候如果只是父进程或者子进程把fd关闭了,那么不影响子进程或者父进程。

CLONE_FS共享文件系统,比如进程的工作目录或者文件系统的根目录。
CLONE_THREAD

这个标志标识将新进程加入到和父进程相同的线程组中。

线程组可以看做就是一个进程,一个进程内的所有线程都属于一个线程组。

我们使用getpid获取进程id的时候,不管是在哪个线程中获取,那么获取的值都是相同的,这个值也叫线程组id,即TGID,thread group id。

3创建进程

创建一个进程的过程并不神秘。举一个我们在c语言中使用结构体的例子,当我们使用c语言的时候,经常使用结构体:使用malloc为结构体申请一块内存,然后再逐个对结构体的成员进行赋值,这是典型的使用步骤。

fork创建一个新的进程,本质上与使用结构体的方式是类似的。在内核中,进程用一个结构体struct task_struct来表示,fork中首先申请了一个struct task_struct,然后将结构体的属性进行初始化,最后将之加入到运行队列。简单来说分为3步:创建对象,初始化对象,使用对象

使用结构体的例子:

#include <stdlib.h>
#include <stdio.h>
#include <string.h>

struct Person {
  char *name;
  int age;
};

int main() {
  struct Person *p = (struct Person *)malloc(sizeof(struct Person));
  if (p == NULL) {
    printf("p is null\n");
    return -1;
  }

  p->name = "xiaoming";
  p->age = 7;
  printf("name:%s,age:%d\n", p->name, p->age);
  return 0;
}

如果使用过c++,那么我们知道,c++中除了构造函数,还有拷贝构造函数以及移动构造函数。对于对象的拷贝来说,又分为浅拷贝和深拷贝,假如对象中有一个成员为char *数据类型,那么拷贝的时候只拷贝指针,就是浅拷贝;拷贝的时候如果将char *指针中的内容都拷贝,那么就是深拷贝。

fork可以看做是构造一个进程,构造进程的过程类似于c++中的浅拷贝。以内存为例,fork之后,子进程会共享父进程的内存资源,并不是把父进程内存中的内容都拷贝了一份到子进程中。当内存被写时,这个时候父子进程的内存才会分家,又称写时拷贝。

3.1kernel_clone

fork的工作都是在函数kernel_clone中完成,kernel_clone做的事情分为3步:

(1)首先,要进行参数检查,主要检查flag的设置,有没有冲突的地方,如果参数检查不通过,则返回错误;否则,进行下一步。

(2)copy_process,这也是最重要的一步,创建一个struct task_struct,然后对结构体成员进行初始化化,从copy_process的名字也可以看出,主要是拷贝,新进程的内容,大部分是从父进程的task_struct中拷贝而来。

(3)进程已经创建,最后就是将进程唤醒,唤醒之后,进程就可以运行了。

pid_t kernel_clone(struct kernel_clone_args *args)
{
    //1.参数检查
	if ((args->flags & CLONE_PIDFD) &&
	    (args->flags & CLONE_PARENT_SETTID) &&
	    (args->pidfd == args->parent_tid))
		return -EINVAL;
	if (!(clone_flags & CLONE_UNTRACED)) {
		if (clone_flags & CLONE_VFORK)
			trace = PTRACE_EVENT_VFORK;
		else if (args->exit_signal != SIGCHLD)
			trace = PTRACE_EVENT_CLONE;
		else
			trace = PTRACE_EVENT_FORK;

		if (likely(!ptrace_event_enabled(current, trace)))
			trace = 0;
	}
    
    //2.copy_process
	p = copy_process(NULL, trace, NUMA_NO_NODE, args);
	
    //3.唤醒进程
	wake_up_new_task(p);
	return nr;
}

3.2copy_process

我的内核代码版本是5.10.186, copy_process函数有542行,fork的核心工作都是在copy_process中完成的。

copy_process中做的主要工作如下:

(1)参数检查

①在不同的命名空间下或者不同的用户下,不允许共享文件系统。

②如果标志中有CLONE_THREAD,说明创建的是一个线程,线程要和创建它的进程共享信号处理函数。

③如果共享信号处理函数,但是没有共享VM,也就是内存,这样是不允许的。

	/*
	 * Don't allow sharing the root directory with processes in a different
	 * namespace
	 */
	if ((clone_flags & (CLONE_NEWNS|CLONE_FS)) == (CLONE_NEWNS|CLONE_FS))
		return ERR_PTR(-EINVAL);

	if ((clone_flags & (CLONE_NEWUSER|CLONE_FS)) == (CLONE_NEWUSER|CLONE_FS))
		return ERR_PTR(-EINVAL);

	/*
	 * Thread groups must share signals as well, and detached threads
	 * can only be started up within the thread group.
	 */
	if ((clone_flags & CLONE_THREAD) && !(clone_flags & CLONE_SIGHAND))
		return ERR_PTR(-EINVAL);

	/*
	 * Shared signal handlers imply shared VM. By way of the above,
	 * thread groups also imply shared VM. Blocking this case allows
	 * for various simplifications in other code.
	 */
	if ((clone_flags & CLONE_SIGHAND) && !(clone_flags & CLONE_VM))
		return ERR_PTR(-EINVAL);

	...

(2)dup_task_struct,创建一个新的task_struct并初始化

在这个函数中首先申请一个task_struct,然后将父进程的task_struct拷贝到新申请的task_struct,然后返回新申请的task_struct,这个新的task_struct就表示新创建的进程。从dup_task_struct函数的名字也可以看出来,是对task_struct的复制。该函数调用之后子进程的task_struct和父进程的task_struct是完全一样。

在该函数之后,会对新的task_struct进行修改,一个最直接的例子就是新进程的pid和父进程pid肯定是不一样的,要单独进行设置。

(3)设置pid

	/* ok, now we should be set up.. */
	p->pid = pid_nr(pid);

(4)资源拷贝

调用了很多以copy开头的函数,对资源进行拷贝。如下是对打开的文件进行拷贝的,在该函数中首先要检查是不是设置了CLONE_FILES,如果设置了,说明要和父进程共享,直接将父进程的引用计数加1;否则,通过dup_fd对打开的文件进行拷贝。从这里可以看到clone和copy的区别,前者是共享,后者是拷贝一份。

static int copy_files(unsigned long clone_flags, struct task_struct *tsk)

{

    ...

    if (clone_flags & CLONE_FILES) {

        atomic_inc(&oldf->count);

        goto out;

    }

    newf = dup_fd(oldf, NR_OPEN_MAX, &error);

    if (!newf)

        goto out;

    tsk->files = newf;

    error = 0;

out:

    return error;

}

	retval = copy_semundo(clone_flags, p);
	if (retval)
		goto bad_fork_cleanup_security;
	retval = copy_files(clone_flags, p);
	if (retval)
		goto bad_fork_cleanup_semundo;
	retval = copy_fs(clone_flags, p);
	if (retval)
		goto bad_fork_cleanup_files;
	retval = copy_sighand(clone_flags, p);
	if (retval)
		goto bad_fork_cleanup_fs;
	retval = copy_signal(clone_flags, p);
	if (retval)
		goto bad_fork_cleanup_sighand;
	retval = copy_mm(clone_flags, p);
	if (retval)
		goto bad_fork_cleanup_signal;
	retval = copy_namespaces(clone_flags, p);
	if (retval)
		goto bad_fork_cleanup_mm;
	retval = copy_io(clone_flags, p);
	if (retval)
		goto bad_fork_cleanup_namespaces;

(5)copy_thread

copy_thread是一个和cpu架构有关的函数,每个cpu架构都实现了自己的copy_thread,在其中主要的工作是设置线程的栈信息。这个函数中做了很重要的事情,我们非常关心的两个问题都是在这个函数中做的:

①fork之后,子进程的返回值为什么是0?

返回值保存在一个特定的寄存器中,在copy_thread中将该寄存器设置为0,那么返回值就为0。

②子进程执行的第一条指令是哪个,也就是说子进程是从哪条指令开始执行的?

在copy_thread中设置新进程第一个执行的函数为ret_from_fork,该函数从内核空间返回到用户空间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值