Shell的强大,很大程度上得益于对命令行做了额外的处理,你可以再命令中嵌入其他命令,在参数中嵌入其他命令,或者嵌入变量,插入路径通配符,插入表达式,Shell都能帮你处理的很好,就因为Shell能做这些,所以Shell才如此强大。
废话少说,直接开始。
首先还是要啰嗦两句,说说Shell处理命令的过程,网上有篇文章写的很不错,很详细,不过我忘记在那儿了,有兴趣的同学可以找找看,用google!我只想说一句:弄清楚Shell处理命令的过程很重要。
简单的说下shell处理命令的过程是:
1.先按<tab> <newline> <space> ( ) < > ; l &把命令分割成一个个的token
2.检查第一个token是不是一个开放的关键字,如for if {等,如果是,说明这是一个复合命令,shell会在内部对关键字进行处理,并重复这一步骤。
3.按别名列表检查每个命令的第一个关键字是不是一个别名,如果是别名,则用其别名定义替换,然后回退到第一步。
4.执行花括号{}扩展
5.执行波浪号~扩展
6.执行变量扩展
7.执行命令替换
8.执行算术表达式计算
9.把生成的新命令按IFS分割成token
10.执行路径扩展
11.按优先级查找命令,先从内置,再从PATH。
12.设定好重定向等,执行命令
过程大致是这样,这里写的很错略,只是为了帮助更好的了解后文。这里要说的就是4,5,6,7,8,10
在Shell中,有六种扩展:花括号、波浪号、变量扩展、命令替换、算术扩展和路径扩展。
花括号扩展:
简单点说就是给一组字符串加上相同的前缀和后缀,生成一组新的字符串。前缀和后缀都可以为空。
[jjz@localhost ~]$ echo a{b,c}d abd acd [jjz@localhost ~]$ echo a{b,c} ab ac
可以使用一个范围,只支持数字和字母。
[jjz@localhost ~]$ echo a{1..10} a1 a2 a3 a4 a5 a6 a7 a8 a9 a10 [jjz@localhost ~]$ echo a{a..f} aa ab ac ad ae af
花括号还可以嵌套,逐层有序的进行处理。
[jjz@localhost ~]$ echo a{{1,2},{b,c}} a1 a2 ab ac
可以认为先生成a{1,2,b,c},然后生成a1 a2 ab ac
要注意的地方:
- 花括号里只有字面量,不要试图使用变量,花括号不支持,比如
[jjz@localhost ~]$ a=1 [jjz@localhost ~]$ echo {$a..10} {1..10}
并没有生成1 2 3 4 5 6 7 8 9 10。对大括号扩展来说,生成的结果是{$a..10} ,那为什么我们看到的会是{1..10}呢?这就和Shell的命令处理顺序有关了,我们再看看Shell的命令处理顺序,花括号扩展是在第四步,到了第六步,会执行变量扩展,这时候相当于 命令echo {$a..10}
$a被替换成了1,当然输出的就是{1..10}了。 - 花括号里至少要有一个逗号,也就是至少要有两项
- 两项之间不能有空格,也就是逗号前后不能有空格,否则不进行花括号扩展。
波浪号扩展
波浪号扩展就是对~进行处理。一般情况下,我们认为~代表了自己的主目录,其实事情并非这么简单。进行波浪号替换的条件是很苛刻的。
首先,进行波浪号扩展的前提是波浪号必须位于一个token的开头,简单的说,~前面应该是空格。
然后,shell会分析波浪号之后,第一个/或:之前的未被引号括起来的字符串(如果没有/,那就取波浪号之后的所有字符),这个字符串叫做"波浪号前缀(tilde-prefix)"(注意,所谓波浪号前缀其实是出现在波浪号后面的),波浪号前缀的取值和对应的处理方式是:
- 如果波浪号前缀是个有效用户名,则波浪号和波浪号前缀一起替换成这个用户的主目录
- 如果波浪号前缀为空,则尝试把波浪号替换成HOME,如果HOME没有被设置,则将波浪号替换成当前用户主目录。
- 如果波浪号前缀是+,则~+被替换成当前工作目录(PWD)
- 如果波浪号前缀是-,则~-被替换成上一个工作目录(OLDPWD)
- 如果波浪号前缀是个数字n,则把~n替换成目录堆栈(用dirs命令可以查看目录堆栈)的第n个元素(这个似乎没什么用)
[jjz@localhost ~]$ echo ~
/home/jjz
[jjz@localhost ~]$ echo /~
/~ 波浪号不是在token的开头,不进行扩展
[jjz@localhost ~]$ echo ~root
/root
[jjz@localhost ~]$ echo ~root/
/root/
[jjz@localhost ~]$ echo ~+
/home/jjz 替换成 当前目录
[jjz@localhost ~]$ echo ~-
~- 替换成上一个目录,因为我没用过cd,上一个目录OLDPWD没有设置,所谓替换失败,原样输出
[jjz@localhost ~]$ cd project
[jjz@localhost project]$ echo ~- 这个好了
/home/jjz
[jjz@localhost project]$
变量扩展
这个大家最熟悉了,$foo!$真是个好东西,变量扩展,命令替换,算术扩展都离不了它(当然还能买东西)。一般情况下我们习惯使用$var,其实正规的格式是${var}。前一种形式更简便,后一种更强大,很多时候必须用后一种形式才行。
先说说间接引用,这东西很像C语言里的指针。
${!var},就是左花括号后面紧跟一个感叹号。bash会把变量的值作为新的变量再求值。
[jjz@localhost project]$ a=b [jjz@localhost project]$ b=1 [jjz@localhost project]$ echo ${!a} 1
其他的操作还是列个表出来,看上去可能更清晰
形式 | 意义 |
${var:-word} | 如果变量var已被设置且非空,则代入它的值,否则带入word |
${var:=word} | 如果变量var已被设置且空,就带入它的值,否则将var设为word并带入var,位置参量不能用这种方式赋值。 |
${var:+word} | 如果var已被设置且值非空,带入word;否则什么都不带入(带入空) |
${var:?word} | 如果var已被设置且值非空,就带入它的值,否则打印word并退出shell。省略word会输出:parameter null or not set |
注意:上面word可以是一个变量,使用$word的形式引用其值 | |
${var:offset} | 获取var中offset开始的字串 |
${var:offset:length} | 获取var中offset开始长为length的字串。 |
注意:上面的offset和length可以使变量,使用$offset,$length引用其值 | |
${#var} | 替换为变量中字符个数,如果var是* ,@或数组,长度则是位置参量的个数。 |
${var%pattern} | 把字符串尾部与模式进行最小匹配,并删除匹配到的部分。 |
${var%%pattern} | 把字符串尾部与模式进行最大匹配,并删除匹配到的部分。 |
${var#pattern} | 把字符串头部与模式进行最小匹配,并删除匹配到的部分。 |
${var##pattern} | 把字符串头部与模式进行最大匹配,并删除匹配到的部分 |
${var/pattern/string} | 使用string替换pattern的最大匹配部分。如果pattern以/开头则进行全部替换,否则只替换第一个匹配的位置。如果pattern以#开始,则起始部分必须匹配,如果以%开始则结尾部分必须匹配 |
注意: 上面的pattern可以使变量,使用$pattern引用其值。 如果var是*、@或数组且以下标为*或@的形式出现,则对其中每一个元素都进行匹配操作。 |
命令替换
用命令的输出来替换命令本身。有两种形式$(cmd)和`cmd`,推荐前一种形式,后一种形式是old-style了。这个没什么好说的,很简单。
算术扩展
用算术表达式的值替换算术表达式本身。格式$((expr))。expr是个表达式,如4+3。理解起来比较简单。不过关于expression,bash有自己特定的支持,某些运算它是做不了的。
[jjz@localhost project]$ echo $((9+2)) 11 [jjz@localhost project]$ b=2 [jjz@localhost project]$ echo $((4+b)) 6 [jjz@localhost project]$
路径扩展
shell扫描每个标记看看是否有*,?和[],这三个就是进行路径扩展的。如果某个标记里出现了三者中的一个或几个,这个标记就被认为是一个模式,shell会对当前目录下的文件列表按文件名排序并逐一与此模式进行比较,如果有匹配这个模式的文件,shell用所有能匹配这个模式的文件名列表替换这个模式。如果没有能匹配这个模式的文件,shell原样保留该模式。当然,shell提供了很多选项,定制匹配成功和失败的处理,还可以选择使用高级的正则表达式,这里不进行讨论,只说说shell的默认情况。此处的三个特殊字符也都比较简单*匹配0到多个字符,?匹配一个字符,[]匹配某个区间里一个字符。