进程管理:fork与exec函数及fork子进程和父进程

http://blog.csdn.net/pipisorry/article/details/25134579

exec函数族

也许有不少读者从本系列文章一推出就开始读,一直到这里还有一个很大的疑惑:既然所有新进程都是由fork产生的,而且由fork产生的子进程和父进程几乎完全一样,那岂不是意味着系统中所有的进程都应该一模一样了吗?而且,就我们的常识来说,当我们执行一个程序的时候,新产生的进程的内容应就是程序的内容才对。是我们理解错了吗?显然不是,要解决这些疑惑,就必须提到我们下面要介绍的exec系统调用。
1.10.1 简介
说是exec系统调用,实际上在Linux中,并不存在一个exec()的函数形式,exec指的是一组函数,一共有6个,分别是:
#include <unistd.h>
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg, ..., char *const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);
int execve(const char *path, char *const argv[], char *const envp[]);
其中只有execve是真正意义上的系统调用,其它都是在此基础上经过包装的库函数。
exec函数族的作用是根据指定的文件名找到可执行文件,并用它来取代调用进程的内容,换句话说,就是在调用进程内部执行一个可执行文件。
这里的可执行文件既可以是二进制文件,也可以是任何Linux下可执行的脚本文件。
与一般情况不同,exec函数族的函数执行成功后不会返回,因为调用进程的实体,包括代码段,数据段和堆栈等都已经被新的内容取代,只留下进程ID等一些表面上的信息仍保持原样。只有调用失败了,它们才会返回一个-1,从原程序的调用点接着往下执行。
现在我们应该明白了,Linux下是如何执行新程序的,每当有进程认为自己不能为系统和拥护做出任何贡献了,他就调用任何一个exec,让自己以新的面貌重生;
或者,更普遍的情况是,如果一个进程想执行另一个程序,它就可以fork出一个新进程,然后调用任何一个exec,这样看起来就好像通过执行应用程序而产生了一个新进程一样。
事实上第二种情况被应用得如此普遍,以至于Linux专门为其作了优化,我们已经知道,fork会将调用进程的所有内容原封不动的拷贝到新产生的子进程中去,这些拷贝的动作很消耗时间,而如果fork完之后我们马上就调用exec,这些辛辛苦苦拷贝来的东西又会被立刻抹掉,这看起来非常不划算,于是人们设计了一种"写时拷贝(copy-on-write)"技术,使得fork结束后并不立刻复制父进程的内容,而是到了真正实用的时候才复制,这样如果下一条语句是exec,它就不会白白作无用功了,也就提高了效率。
1.10.2 稍稍深入
在学习它们之前,先来了解一下我们习以为常的main函数。
int main(int argc, char *argv[], char *envp[])
这才是main函数真正完整的形式。
参数argc指出了运行该程序时命令行参数的个数,
数组argv存放了所有的命令行参数,
数组envp存放了所有的环境变量。环境变量指的是一组值,从用户登录后就一直存在,很多应用程序需要依靠它来确定系统的一些细节,我们最常见的环境变量是PATH,它指出了应到哪里去搜索应用程序,如/bin;HOME也是比较常见的环境变量,它指出了我们在系统中的个人目录。环境变量一般以字符串"XXX=xxx"的形式存在,XXX表示变量名,xxx表示变量的值。
值得一提的是,argv数组和envp数组存放的都是指向字符串的指针,这两个数组都以一个NULL元素表示数组的结尾。
我们可以通过以下这个程序来观看传到argc、argv和envp里的都是什么东西:
/* main.c */
int main(int argc, char *argv[], char *envp[]){
 printf("\n### ARGC ###\n%d\n", argc);
 printf("\n### ARGV ###\n");
 while(*argv)
  printf("%s\n", *(argv++));
 printf("\n### ENVP ###\n");
 while(*envp)
  printf("%s\n", *(envp++));
 return 0;
}
 编译它:$ cc main.c -o main
运行时,我们故意加几个没有任何作用的命令行参数:
$ ./main -xx 000
### ARGC ###
3
### ARGV ###
./main
-xx
000
### ENVP ###
PWD=/home/lei
REMOTEHOST=dt.laser.com
HOSTNAME=localhost.localdomain
QTDIR=/usr/lib/qt-2.3.1
LESSOPEN=|/usr/bin/lesspipe.sh %s
KDEDIR=/usr
USER=lei
LS_COLORS=
MACHTYPE=i386-redhat-linux-gnu
MAIL=/var/spool/mail/lei
INPUTRC=/etc/inputrc
LANG=en_US
LOGNAME=lei
SHLVL=1
SHELL=/bin/bash
HOSTTYPE=i386
OSTYPE=linux-gnu
HISTSIZE=1000
TERM=ansi
HOME=/home/lei
PATH=/usr/local/bin:/bin:/usr/bin:/usr/X11R6/bin:/home/lei/bin
_=./main
我们看到,程序将"./main"作为第1个命令行参数,所以我们一共有3个命令行参数。这可能与大家平时习惯的说法有些不同,小心不要搞错了。
现在回过头来看一下exec函数族,先把注意力集中在execve上:
int execve(const char *path, char *const argv[], char *const envp[]);
对比一下main函数的完整形式,看出问题了吗?是的,这两个函数里的argv和envp是完全一一对应的关系。
execve第1个参数path是被执行应用程序的完整路径,
第2个参数argv就是传给被执行应用程序的命令行参数
第3个参数envp是传给被执行应用程序的环境变量。
留心看一下这6个函数还可以发现,前3个函数都是以execl开头的,后3个都是以execv开头的,它们的区别在于,
execv开头的函数是以"char *argv[]"这样的形式传递命令行参数,
execl开头的函数采用了我们更容易习惯的方式,把参数一个一个列出来,然后以一个NULL表示结束。这里的NULL的作用和argv数组里的NULL作用是一样的。
在全部6个函数中,只有execle和execve使用了char *envp[]传递环境变量,其它的4个函数都没有这个参数,
这并不意味着它们不传递环境变量,这4个函数将把默认的环境变量不做任何修改地传给被执行的应用程序。
而execle和execve会用指定的环境变量去替代默认的那些。
除execlp和execvp之外的4个函数都要求,它们的第1个参数path必须是一个完整的路径,如"/bin/ls";
而execlp和execvp的第1个参数file可以简单到仅仅是一个文件名,如"ls",这两个函数可以自动到环境变量PATH制定的目录里去寻找。
1.10.3 实战
/* exec.c */
#include <unistd.h>
main(){
 char *envp[]={"PATH=/tmp",   "USER=lei",   "STATUS=testing",   NULL};
 char *argv_execv[]={"echo", "excuted by execv", NULL};
 char *argv_execvp[]={"echo", "executed by execvp", NULL};
 char *argv_execve[]={"env", NULL};
 if(fork()==0)
  if(execl("/bin/echo", "echo", "executed by execl", NULL)<0)
   perror("Err on execl");
 if(fork()==0)
  if(execlp("echo", "echo", "executed by execlp", NULL)<0)
   perror("Err on execlp");
 if(fork()==0)
  if(execle("/usr/bin/env", "env", NULL, envp)<0)
   perror("Err on execle");
 if(fork()==0)
  if(execv("/bin/echo", argv_execv)<0)
   perror("Err on execv");
 if(fork()==0)
  if(execvp("echo", argv_execvp)<0)
   perror("Err on execvp");
 if(fork()==0)
  if(execve("/usr/bin/env", argv_execve, envp)<0)
   perror("Err on execve");
}
 
程序里调用了2个Linux常用的系统命令,echo和env。echo会把后面跟的命令行参数原封不动的打印出来,env用来列出所有环境变量。
由于各个子进程执行的顺序无法控制,所以有可能出现一个比较混乱的输出--各子进程打印的结果交杂在一起,而不是严格按照程序中列出的次序。
编译并运行:
$ cc exec.c -o exec
$ ./exec
executed by execl
PATH=/tmp
USER=lei
STATUS=testing
executed by execlp
excuted by execv
executed by execvp
PATH=/tmp
USER=lei
STATUS=testing
 
果然不出所料,execle输出的结果跑到了execlp前面。
大家在平时的编程中,如果用到了exec函数族,一定记得要加错误判断语句。因为与其他系统调用比起来,exec很容易受伤,被执行文件的位置,权限等很多因素都能导致该调用的失败。最常见的错误是:
找不到文件或路径,此时errno被设置为ENOENT;
数组argv和envp忘记用NULL结束,此时errno被设置为EFAULT;
没有对要执行文件的运行权限,此时errno被设置为EACCES。
 
exec用被执行的程序完全替换调用它的程序的影像。fork创建一个新的进程就产生了一个新的PID,
exec启动一个新程序,替换原有的进程,因此这个新的被exec执行的进程的PID不会改变,
和调用exec函数的进程一样。
int   exec…装入和运行其它程序:
int   execl(  char *pathname,char *arg0,char *arg1,...,char *argn,NULL)
int   execle( char *pathname,char *arg0,char *arg1,...,char *argn,NULL,char *envp[])
int   execlp( char *pathname,char *arg0,char *arg1,...,NULL)
int   execlpe(char *pathname,char *arg0,char *arg1,...,NULL,char *envp[])
int   execv(  char *pathname,char *argv[])
int   execve( char *pathname,char *argv[],char *envp[])
int   execvp( char *pathname,char *argv[])
int   execvpe(char *pathname,char *argv[],char *envp[])
         exec函数族装入并运行程序pathname,并将参数
          arg0(arg1,arg2,argv[],envp[])传递给子程序,出错返回-1
       在exec函数族中,后缀l、v、p、e添加到exec后,
       所指定的函数将具有某种操作能力
      有后缀  p时,函数可以利用DOS的PATH变量查找子程序文件。
假如你希望执行命令 /bin/cat /etc/passwd /etc/group,
    l时,希望接收以逗号分隔的参数列表,列表以NULL指针作为结束标志
        execl( "/bin/cat","/etc/passed","/etc/group",NULL);
    v时,希望接收到一个以NULL结尾的字符串数组的指针
        char* argv[] = {"/bin/cat","/etc/passed","/etc/group",NULL}
        execv( "/bin/cat", argv );
    e时,函数传递指定参数envp,允许改变子进程的环境,无后缀e时,子进程使用当前程序的环境。
        envp也是一个以NULL结尾的字符串数组指针
        
    
execl(执行文件)
相关函数
    fork,execle,execlp,execv,execve,execvp
表头文件
    #include<unistd.h>
定义函数
    int execl(const char * path,const char * arg,....);
函数说明
    execl()用来执行参数path字符串所代表的文件路径,接下来的参数代表执行该文件时传递过去的argv(0)、argv[1]……,最后一个参数必须用空指针(NULL)作结束。
返回值
    如果执行成功则函数不会返回,执行失败则直接返回-1,失败原因存于errno中。
范例
    #include<unistd.h>
main()
{
execl(“/bin/ls”,”ls”,”-al”,”/etc/passwd”,(char * )0);
}
执行
    /*执行/bin/ls -al /etc/passwd */
-rw-r--r-- 1 root root 705 Sep 3 13 :52 /etc/passwd
 
    
execlp(从PATH 环境变量中查找文件并执行)
相关函数
    fork,execl,execle,execv,execve,execvp
表头文件
    #include<unistd.h>
定义函数
    int execlp(const char * file,const char * arg,……);
函数说明
    execlp()会从PATH 环境变量所指的目录中查找符合参数file的文件名,找到后便执行该文件,然后将第二个以后的参数当做该文件的argv[0]、argv[1]……,最后一个参数必须用空指针(NULL)作结束。
返回值
    如果执行成功则函数不会返回,执行失败则直接返回-1,失败原因存于errno 中。
错误代码
    参考execve()。
范例
    /* 执行ls -al /etc/passwd execlp()会依PATH 变量中的/bin找到/bin/ls */
#include<unistd.h>
main()
{
execlp(“ls”,”ls”,”-al”,”/etc/passwd”,(char *)0);
}
执行
    -rw-r--r-- 1 root root 705 Sep 3 13 :52 /etc/passwd
 
    
execv(执行文件)
相关函数
    fork,execl,execle,execlp,execve,execvp
表头文件
    #include<unistd.h>
定义函数
    int execv (const char * path, char * const argv[ ]);
函数说明
    execv()用来执行参数path字符串所代表的文件路径,与execl()不同的地方在于execve()只需两个参数,第二个参数利用数组指针来传递给执行文件。
返回值
    如果执行成功则函数不会返回,执行失败则直接返回-1,失败原因存于errno 中。
错误代码
    请参考execve()。
范例
    /* 执行/bin/ls -al /etc/passwd */
#include<unistd.h>
main()
{
char * argv[ ]={“ls”,”-al”,”/etc/passwd”,(char*) }};
execv(“/bin/ls”,argv);
}
执行
    -rw-r--r-- 1 root root 705 Sep 3 13 :52 /etc/passwd
 
    
execve(执行文件)
相关函数
    fork,execl,execle,execlp,execv,execvp
表头文件
    #include<unistd.h>
定义函数
    int execve(const char * filename,char * const argv[ ],char * const envp[ ]);
函数说明
    execve()用来执行参数filename字符串所代表的文件路径,第二个参数系利用数组指针来传递给执行文件,
    argv要传递给程序的完整参数列表,包括argv[0],它一般是执行程序的名字;最后一个参数则为传递给执行文件的新环境变量数组。
返回值
    如果执行成功则函数不会返回,执行失败则直接返回-1,失败原因存于errno 中。
错误代码
    EACCES
1. 欲执行的文件不具有用户可执行的权限。
2. 欲执行的文件所属的文件系统是以noexec 方式挂上。
3.欲执行的文件或script翻译器非一般文件。
EPERM
1.进程处于被追踪模式,执行者并不具有root权限,欲执行的文件具有SUID 或SGID 位。
2.欲执行的文件所属的文件系统是以nosuid方式挂上,欲执行的文件具有SUID 或SGID 位元,但执行者并不具有root权限
/****************************************************************************
**
**    execve.c--Illustrate the usage of execve
**
*****************************************************************************/
#include <unistd.h>
#include <stdlib.h>
#include <stdio.h>
int main( void )
{
    char* args[] = { "/bin/ls", NULL };
    if ( -1 == (execve("/bin/ls", args, NULL)) )
    {
        perror( "execve" );
        exit( EXIT_FAILURE);
    }
    
    puts( "shouldn't get here" );
    exit( EXIT_SUCCESS );
}
[root @localhost src]# gcc execve.c 
[root @localhost src]# ./a.out 
a.out  child_fork.c  execve.c  fork.c  getpid.c


linux中fork创建的新子进程和父进程之间的区别

[fork出的子进程和父进程]

from:http://blog.csdn.net/pipisorry/article/details/25134579

ref:Linux下Fork与Exec使用
Linux进程学习总结
进程控制函数之exec()函数的学习


转载于:https://my.oschina.net/u/3579120/blog/1508478

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值