看到进程clone、fork 和 vfork这章时,些许问题不明白,遂百度,粘贴下他人成果如下。一来作积累之用,二来亦可方便他人搜索。
clone fork 及vfork最终都是调用do_fork来实现的,根据do_fork所携带参数之不同达到不同的目的
1. fork创造的子进程复制了父进程资源,包括内存及进程描述符的内容,注意是资源的复制而不是指针的复制,当然,用户也不需要太大担心性能的问题,Linux采用的写时复制技术能让fork的性能大幅提升
2. vfork的行为更像一个线程(指没有自已独立的内存空间),更明显的是vfork的调用将挂起当前进程(即父进程)
3. 相对上面两者而言,clone显得很复杂,根据flag的不同可以实现不同的功能
FLAG 含义
CLONE_PARENT 创建的子进程的父进程是调用者的父进程,新进程与创建它的进程成了“兄弟”而不是“父子”
CLONE_FS 子进程与父进程共享相同的文件系统,包括root、当前目录、umask
CLONE_FILES 子进程与父进程共享相同的文件描述符(file descriptor)表
CLONE_NEWNS 在新的namespace启动子进程,namespace描述了进程的文件hierarchy
CLONE_SIGHAND 子进程与父进程共享相同的信号处理(signal handler)表
CLONE_PTRACE 若父进程被trace,子进程也被trace
CLONE_VFORK 父进程被挂起,直至子进程释放虚拟内存资源
CLONE_VM 子进程与父进程运行于相同的内存空间
CLONE_PID 子进程在创建时PID与父进程一致
CLONE_THREAD Linux 2.4中增加以支持POSIX线程标准,子进程与父进程共享相同的线程群
以上
在内核代码 2.6.15.5中
/kernel/fork.c
第1255-1261中有如下代码:
1.p=copy_process(clone_flags,stack_start,regs,stack_size,parent_tidptr,child_tidptr,pid);2.if(!IS_ERR(p)){3.structcompletion vfork;4 .if(clone_flags&CLONE_VFORK){5.p->vfork_done=&vfork;6.init_completion(&vfork);7.}
为了方便描述我在这段代码上加了行号。
第一行首先通过copy_process()函数完成具体的进程创建工作,返回值类型为task_t类型。
第2行用函数 IS_ERR()分析copy_process()的返回值是否正确。如果正确则执行第3-7行代码。
这里分析一下接下来这几行代码:
struct completion vfork; //定义struct completion 类型的变量 vfork;
关于struct completion的定义如下:
struct completion {
unsigned int done;
wait_queue_head_t wait;
}
第4行判断clone_flags中是否有CLONE_VFORK标志。如果有则执行下面的的代码:
p->vfork_done = &vfork;
init_completion(&vfork);
在task_struct结构体中vfork_done是这样定义的:
struct completion * vfork_done;
函数init_completion()定义如下:
static inline void init_completion(struct completion *x)
{
x->done = 0;
init_waitqueue_head(&x->wait);
}
这个函数的作用是在进程创建的最后阶段,父进程会将自己设置为不可中断状态,然后睡眠在
等待队列上(init_waitqueue_head()函数 就是将父进程加入到子进程的等待队列),等待子进程的唤醒。
init_waitqueue_head()函数定义如下:
static inline void init_waitqueue_head(wait_queue_head_t *q)
{
spin_lock_init(&q->lock);
INIT_LIST_HEAD(&q->task_list);
}
spin_lock_init()定义如下:
#define spin_lock_init(lock) do { *(lock) = SPIN_LOCK_UNLOCKED;} while(0);
wait_queue_head_t 定义如下:
struct __wait_queue_head {
spinlock_t lock;
struct list_head task_list;
}
typedef struct __wait_queue_head wait_queue_head_t;
INIT_LIST_HEAD(ptr) do { \
(ptr)->next = (ptr); (ptr) ->prev = (ptr);} while(0);
我们可以这么看vfork
struct completion {
unsigned int done;
spinlock_t lock;
struct list_head task_list;
}
最终结果;
done = 0;
lock = SPIN_LOCK_UNLOCKED;
task_list.prev = task_list;
task_list.next = task_list;
p->vfork_done = &vfork;
至此这段代码只是对当前子进程的等待对列进行了初始化。
在fork.c的1281行还有这样的代码:
if (clone_flags & CLONE_VFORK) {
wait_for_completion(&vfork);
. ......
}
这时才将当前进程加入到了子进程的等待队列。
下面是wait_for_completion()函数的定义:
voidfastcall __sched wait_for_completion(structcompletion*x){might_sleep();spin_lock_irq(&x->wait.lock);if(!x->done){DECLARE_WAITQUEUE(wait,current);wait .flags|=WQ_FLAG_EXCLUSIVE;__add_wait_queue_tail(&x->wait,&wait);do{__set_current_state(TASK_UNINTERRUPTIBLE);spin_unlock_irq(&x->wait.lock);schedule();spin_lock_irq(&x->wait.lock);}while(!x->done);__remove_wait_queue(&x->wait,&wait);}x->done--;spin_unlock_irq(&x->wait.lock);}
这里关于fastcall和__sched的定义如下(分别定义在内核以下两个文件中
include/asm-i386/linkage.h
kernel/sched.h
):
#define fastcall __attribute__((regparm(3)))
#define __sched __attribute__((__section__(".sched.text")))
这两个宏定义使用了GNU C扩展。
GNU C 允许声明函数,变量和类型的特殊属性,以便手工的代码和更仔细的代码检查。要指定一个声明的属性,在声明后写:
__attribute__((ATTRIBUTE))
其中ATTRIBUTE是属性说明。其中属性section用于函数和变量,其作用是:通常编译器将函数放在.text节,变量放在.data或.bss节,用section属性,可以让编译器将函数或变量放在指定的节中。
这样连接器可以将相同节的代码或数据安排在一起。这在linux内核中是很常见的。