(一)grep:正则表达式
         Linux文本处理三剑客:
             grep: 文本过滤工具;
             sed:文本编辑器(行);stream editor
             awk:文本报告生成器;Linux上awk的实现为gawk

     grep: Global search REgular expression and Print out the line.
             作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的行;
             模式:由正则表达式的元字符及文本字符所编写的过滤条件;

             元字符:字符不表示其字面意义,而用于表示通配或控制功能;

     分两类:
             基本正则表达式:BRE
             扩展正则表达式:ERE

 语法格式:grep [OPTIONS] PATTERN [FILE...]:
     选项:
            --color=auto:对匹配到的串做高亮显示;
wKiom1Xmj4SBBo6aAACBH1g0YC8703.jpg

             -v:显示模式匹配不到行;

wKiom1Xmj8KR6MbfAAHWzPUBloo000.jpg              -i: 忽略字符大小写;

wKiom1XmkEPidr-XAABLkpBgkNI418.jpg               -o: 仅显示能够被模式匹配到的串而非行;

wKioL1Xmkqfw8xuZAABc_6ba_EU885.jpg            -q: 静默模式;
            -E:使用扩展的正则表达式

 基本正则表达式的元字符:
   字符匹配:
            .: 匹配任意单个字符;
            []:匹配指定范围内的任意单个字符;
            [^]:匹配指定范围内的任意单个字符;

            [:lower:]:所有小写字母

            [:upper:]:所有大写字母

            [:alpha:]:所有字母

            [:alnum:]:所有数字和字母

            [:digit:]:所有数字

            [:space:]:所有空白字符

            [:punct:]:所有标点符号

 

  次数匹配:用于要指定其次数的字符的后面;
            *: 任意次;
    

            \?:0或1次;
     grep "x\?y"

            \+:1或多次;
            \{m\}:精确限制为m次;
            \{m,n\}: 至少m次,至多n次,[m,n]
            \{0,n\}:至多n次;
            \{m,\}:至少m次;

            .*: 匹配任意长度的任意字符;

  位置锚定:
           ^: 行首锚定;用于模式的最左侧;
           $: 行尾锚定;用于模式的最右侧;
           \<, \b: 词首锚定;用于表示单词的模式的左侧;
           \>, \b:词尾锚定;用于表示单词的模式的右侧;
           ^$: 空白行;

  分组:\(\)

      分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是\1, \2, ...
           \1: 从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;
           \2:
           ...

  后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符;

  

(二) 扩展的正则表达式:egrep
    注:扩展正则表达式的使用方法基本相同只有部分参数是不需要添加\转意符使用的,

如下:
  次数匹配       

           ?: 0次或1次;
           +: 1次以上;
           {m}: 精确匹配m次;
           {m,n}: 至少m次,至多n次;

  分组:()
  或者:a|b
           C|cat: 不表示Cat或cat,而表示C或cat;要写成(C|c)at

 

 

 

 

 

练习:

1.显示/etc/passwd文件中以bash结尾的行;

正则表达式:  #grep ‘\(bash\)\>’/etc/passwd

 wKiom1XiU9Wx0CrhAADxdTq6dtw641.jpg

扩展正则表达式  #egrep ‘(bash)\>’/etc/passwd

wKioL1XiVf2zeasyAAD4LLjek-8658.jpg

2.显示/etc/passwd文件中的两位数或三位数;

正则表达式:#grep -o '[0-9]\{2,3\}' /etc/passwd

wKiom1XiU_yQhJ-2AABqK9AEfQ0479.jpg

扩展正则表达式:# egrep -o '[0-9]{2,3}' /etc/passwd

 

3.显示‘netstat–tan ’命令结果中以‘LISTEN’后跟0个、1个或多个空白字符结尾的行;

正则表达式:# netstat -tan|grep '\(LISTEN\)[[:space:]]\?\+'

wKioL1XiViahojxbAAByjjRpDA4905.jpg

扩展正则表达式:# netstat -tan|egrep '(LISTEN)[[:space:]]?+'

 

4.添加用户bashtestbashbasher以及nologin用户(nologin用户的shell/sbin/nologin;而后找出/etc/passwd文件中用户名同shell名的行;

正则表达式:# grep '^\(.*\):.*\1$' /etc/passwd

wKiom1XiVBWiYMoIAADEyoWnVEM148.jpg

扩展正则表达式:# egrep '^(.*):.*\1$' /etc/passwd

wKiom1XiVB_hXCKoAADkj27n3hw325.jpg

 

 

 

 

扩展正则表达式练习题:

1.显示当前系统上rootcentosuser1用户的默认shellUID

# egrep '^(root):|(centos):|(user1):' /etc/passwd |cut -d:-f3,7

wKioL1XiVkmhy7otAAB6rC6mzEk989.jpg

2.找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行;

正则表达式:# grep '\([[:alpha:]]\+_*[[:alpha:]]\+\)()'/etc/rc.d/init.d/functions

wKiom1XiVD7xz4V7AAEvOy8FQW4539.jpg

扩展正则表达式:#egrep '([[:alpha:]]{1,}_{0,}[[:alpha:]]{1,})\(\)' /etc/rc.d/init.d/functions

wKiom1XiVEyRXqapAAFsT8CoEUw023.jpg

3.使用echo输出一个路径,而后egrep找出其路径基名;

进一步地:使用egrep取出其目录名

取基名:

#echo /etc/init.d/functions | egrep --color=auto -o '[[:alnum:]]+$'

 wKioL1XmdD3Svv65AABO3YQKZTg255.jpg

 

 

#echo /etc/init.d/functions/ | egrep --color=auto -o  '[[:alnum:]]+/?$'
wKiom1XmctLgorW6AABVVaexpPw702.jpg

取路径名

# echo /etc/init.d/functions |egrep --color=auto -o  '^.*+/'

 wKioL1XmdW_xNMsfAABQz010UJM739.jpg

 

 

 

4.找出ifconfig命令执行结果中1-255之间的数字

#ifconfig | egrep --color=auto -o "/<[1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-5][0-5]/>"

 wKioL1Xmd8HgfU2yAACTOnIpvhc001.jpg