8-28 正则表达命令详解及练习-CSDN博客

（一）grep:正则表达式
        Linux文本处理三剑客：
             grep: 文本过滤工具；
             sed：文本编辑器(行)；stream editor
             awk：文本报告生成器；Linux上awk的实现为gawk

     grep: Global search REgular expression and Print out the line.
             作用：文本搜索工具，根据用户指定的“模式(pattern)”逐行去搜索目标文本，打印匹配到的行；
             模式：由正则表达式的元字符及文本字符所编写的过滤条件；

元字符：字符不表示其字面意义，而用于表示通配或控制功能；

     分两类：
             基本正则表达式：BRE
            扩展正则表达式：ERE

语法格式：grep [OPTIONS] PATTERN [FILE...]：
选项：
--color=auto：对匹配到的串做高亮显示；

-v：显示模式匹配不到行；

-i: 忽略字符大小写；

-o: 仅显示能够被模式匹配到的串而非行；

-q: 静默模式；
-E：使用扩展的正则表达式；

基本正则表达式的元字符：
   字符匹配：
            .: 匹配任意单个字符；
            []：匹配指定范围内的任意单个字符；
            [^]：匹配指定范围内的任意单个字符；

[:lower:]：所有小写字母

[:upper:]:所有大写字母

[:alpha:]:所有字母

[:alnum:]:所有数字和字母

[:digit:]:所有数字

[:space:]:所有空白字符

[:punct:]:所有标点符号

次数匹配：用于要指定其次数的字符的后面；
*: 任意次；

\?：0或1次；
grep "x\?y"

            \+：1或多次;
            \{m\}：精确限制为m次；
            \{m,n\}: 至少m次，至多n次，[m,n]
            \{0,n\}：至多n次；
            \{m,\}：至少m次；

.*: 匹配任意长度的任意字符；

  位置锚定：
           ^: 行首锚定；用于模式的最左侧；
           $: 行尾锚定；用于模式的最右侧；
           \<, \b: 词首锚定；用于表示单词的模式的左侧；
           \>, \b：词尾锚定；用于表示单词的模式的右侧；
           ^$: 空白行；

分组：

      分组的小括号中的模式匹配到的内容，会在执行过程中被正则表达式引擎记录下来，并保存内置的变量中；这些变量分别是\1, \2, ...
           \1: 从左侧起，第一个左括号，以及与之配对的右括号中间的模式所匹配到的内容；
           \2：
           ...

后向引用：使用变量引用前面的分组括号中的模式所匹配到的字符；

（二）扩展的正则表达式：egrep
注：扩展正则表达式的使用方法基本相同只有部分参数是不需要添加\转意符使用的，

如下：
次数匹配

           ?: 0次或1次；
          +: 1次以上；
           {m}: 精确匹配m次；
           {m,n}: 至少m次，至多n次；

  分组：()
  或者：a|b
           C|cat：不表示Cat或cat，而表示C或cat；要写成(C|c)at

练习：

1.显示/etc/passwd文件中以bash结尾的行；

正则表达式： #grep ‘$bash$\>’/etc/passwd