圆括号在正则表达式中有着十分重要的作用.
在shell中的圆括号和正则中的圆括号是有区别的.在shell中圆括号意味着进程替换,比如 (var=1)表示在子shell(子进程)中创建变量var并赋值为1,然后返回在当前shell(父进程)中,如果执行echo $var是会得到空值的. 即子shell的变量随着子shell的结束而消失,并不会出现在当前shell中.
下面是圆括号在正则表达式中的作用.
1.最常用的使用就是分组.比如我们要匹配如 123-45678 这样的数字,可以用 grep -E '([0-9]{3})-([0-9]{5})'这样的方式.在这之中圆括号就起到了分组的作用,将123-45678以"-"为分隔符分你成两组进行表示.
对于grep中使用到的-E选项, 正则表达式是有BRE和ERE两种方式的. 这两种方式的区别在于元字符的不同. 在BRE中只承认^ $ . [ ] * 这6个元字符. 也即没有圆括号. 所以在上面这个例子中如果没有-E选项,则需要\([0-9]{3}\)这样的表达方式. 而在ERE中则添加了 ( ) { } ? + | 这几个元字符,相应的,使用ERE时需要加入-E选项.
2.配和 | 使用还可以用来表示选择. 比如b(o|u)y可以用来表示 boy或者buy. 这一性质有容易出错的地方,比如匹配(a|ab)时,永远只能匹配到a,而不会匹配到ab.应该使用(ab|a),这样才能匹配到ab,原因出在分支匹配符号"|"上,当左边的测试满足条件时,将不会匹配右边的表达式.
3.使用圆括号进行匹配结果的反向引用. 比如 echo "123456-abcded" | sed 's/\([0-9]*\)-\([a-z]*\)/\2/', 在这里有两组括号,第一组是[0-9]*匹配到的123456,第二组就是[a-z]*匹配到的abcded,因此\2就代表第二组匹配abcded的反向引用,命令最后输出的结果也是abcded. 需要注意的是在正则表达式中反向引用最多只能使用9组,即\1~\9.
由于最近刚学正则,没有太多经验,之后碰到的情况再来补. :)