一、我们从exec族函数谈起
如果你从不写C程序,可能需要对本节的内容看得更为仔细并且试验一下。
#include <unistd.h> extern char **environ; int execl(const char *path, const char *arg, ...); int execlp(const char *file, const char *arg, ...); int execle(const char *path, const char *arg , ..., char * const envp[]); int execv(const char *path, char *const argv[]); int execvp(const char *file, char *const argv[]);
对于解释器,exec族函数是这样做的(以execl为例),如果path是指向了一个脚本,脚本的第一行以#!开头,则这样调用:
以#!后面的字符串为命令,后面加上execl参数列表中指定的参数列表,这样形成了新的程序执行。
下面我们以例子来验证这个结果:
下面这个C程序的作用是回射所有命令行参数。
/* Program source : showargs.c * * Program name : showargs */ #include <unistd.h> int main(int argc, char *argv[]) { int i; for(i = 0; i < argc; i++) { printf("arg[%d]: %s/n", i, argv[i]); } return 0; }
执行:
$ pwd /home/kiron $ ./showargs arg1 arg2 arg[0]: ./showargs arg[1]: arg1 arg[2]: arg2
我们在同一个目录下再写一个脚本:
#!/home/kiron/showargs addargs
$ ./testexec arg[0]: /home/kiron/showargs arg[1]: addargs arg[2]: ./testexec
/* Program source : mytest.c * * Program name : mytest */ #include <stdio.h> int main(void) { execl("/home/kiron/testexec", "testexec", "arg1", "arg2", (char *) 0); return 0; }
执行:
$ ./mytest arg[0]: /home/kiron/showargs arg[1]: addargs arg[2]: /home/kiron/testexec arg[3]: arg1 arg[4]: arg2
注意:#!行中的解释器的路径必须是全路径,exec函数并不对其特殊处理,比如用PATH变量来搜索它的真实路径,所以路径是由程序员来保证正确的。
二、我的脚本第一句必须得是#!/bin/bash吗?
当然不必了,通过上面的解释,其实第一句的#!是对脚本的解释器程序路径,脚本的内容是由解释器解释的,我们可以用各种各样的解释器来写对应的脚本,比如说/bin/csh脚本,/bin/perl脚本,/bin/awk脚本,/bin/sed脚本,甚至/bin/echo等等。那我们真的能写一个/bin/echo的脚本文件吗?我们来试试,下面是一个例子:
#!/bin/echo -e
$ ./myecho "hi/a" ./myecho hi
三、我能利用解释器来做什么?
但是上面的echo脚本实际应用时并没有什么作用,我们可以得出一个小小的实验结果,并不是所有的可执行二进制文件都可以用来写解释器脚本。那我编写解释器的脚本有什么用?如果你有一个可编程的解释器,那你或许能编写该解释器的程序来简化你工作。比如说常用到的解释器如awk,perl,bash等等。但是正如我们上面总结的实验结果,很不幸地,并不是全部的可编程程序都是有用的解释器,exec脚本时,能从第一行得到脚本的解释器,然后用exec去解释脚本(可能是选项去控制,如#!/bin/awk -f),也包括了形如#!/PATH/的第一行,如果该解释器对这行不能忽略的话,就会出错,另外解释器也必须要对余下的程序语句能解释(这句好像是废话,但想象一下,上面myecho程序加一些"hello world"的行来,会有效吗?下面的mysed程序中的s/UNIX/unix/p也是一样的道理)。像awk,perl,bash等程序对#开头的行当成注释行处理,就能写成有用的脚本。
再看下面的mysed程序,
#!/bin/sed -f s/UNIX/unix/p
所以,有用的解释器应该是类似bash,perl,awk的程序,并且能对一些规定的语句有解释功能的。下面给出一个awk程序写的统计文件行数和单词数的脚本程序myawk。
#!/usr/bin/awk -f BEGIN { sum = 0; } {sum += NF;} END { printf("file /"%s/" have %d line, %d words./n", FILENAME, NR, sum); }
$ echo -e "hi/nhello world">test.txt $ ./myawk test.txt file "test.txt" have 2 line, 3 words
这里执行./myawk被执行成“/usr/bin/awk -f ./myawk test.txt”,因为awk的命令中,以#开头的行被认为是注释行而忽略,awk忽略了第一行"#!/usr/bin/awk -f",正确的以非#开头行当成模式和命令的输入并能对其解释,所以这个程序是正确的,能被顺利地执行。
另外,exec对传给它的设置了执行位的文件,它会检查它,如果是机器可执行的,则把arg0,arg1....传给此机器可执行程序,开始执行此程序。如果不是机器可执行的,则将认为它是一个脚本文件,然后检查此文件的第一行中的开头的#!,如果第一行没有#!,可能就退出程序了(这个应该是依赖于实现?)。如果有开头的#!,便按照上面我的帖子里的描述,把#!后面的字串加上exec参数里应该传给可执行文件的参数列表,这个参数列表相当于我们在shell里输入的:
$ ls -l
这样的序列。
对于execl函数,不知道你有没有man过?
int execl(const char *path, const char *arg, ...);
第一个参数是你要执行的文件的路径,第二个参数是基本的不带路径的文件名,后面就是argv[1],argv[2]了。
那么实际要传给脚本文件的参数为:/home/kiron/testexec arg1 arg2
这并不是可有可无的全路径,但你可以把它改成相对路径(这样上面的就该改成: ./PHTH/testexec arg1 arg2了),这是可行的,但绝不能使用~这样的符号,这是由shell扩展的,和exec是无关的。对于第二个参数arg,则是用来确定一下文件的程序名
execl这样才能指定怎么找到testexec。
前面已经说了,是#!后面的字串,加上实际要传给脚本文件的参数:/home/kiron/testexec arg1 arg2形成了:
/home/kiron/showargs addargs /home/kiron/testexec arg1 arg2
如果你在execl用了相对路径:
/home/kiron/showargs addargs ./PATH/testexec arg1 arg2
然后就形成了新的执行序列,这个序列的效果和你在shell提示符下输入相应的序列的效果是一样的