正则表达式

正则表达式

1.正则表达式分类

正则表达式分为两类:
基本正则表达式
扩展正则表达式

2.基本正则表达式

元字符

  • . 任意单个字符
[root@lwq opt]# ls
 aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "a."
aa
aaacd
ab
abcd
[root@lwq opt]# ls | grep "a.."
aaacd
abcd
  • [] 匹配指定范围内任意单个字符
[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep [b]
ab
abcd
bcd
bcf
[root@lwq opt]# ls | grep [a-c]
aa
aaacd
ab
abcd
bcd
bcf
  • [^] 匹配指定范围外任意单个字符
    ^指取反
[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep [^a-c]
aaacd
abcd
bcd
bcf

匹配次数(贪婪模式)

  • *  匹配其前面的任意单个字符任意次 
    
[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "ab*"
aa
aaacd
ab
abcd
  • .* 任意长度的任意字符
[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "a.*d"
aaacd
abcd
[root@lwq opt]# ls | grep ".*c"
aaacd
abcd
bcd
bcf
[root@lwq opt]# ls | grep ".*"
aa
aaacd
ab
abcd
bcd
bcf
  • \ ?匹配其前面的任意单个字符1次或0次
[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "a\?c"
aaacd
abcd
bcd
bcf
  • \ + 匹配其前面的任意单个字符至少1次
[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "a\+c"
aaacd
[root@lwq opt]# ls | grep "a\+b"
ab
abcd
  • \ {m,n}匹配其前面的任意单个字符至少m次,至多n次
[root@lwq opt]# ls
 aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "a\{1,3\}b"
ab
abcd
[root@lwq opt]# ls | grep "a\{1,3\}c"
aaacd

位置锚定

  • ^ 锚定行首,此字符后面的任意单个字符必须出现在行首
[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "^a"
aa
aaacd
ab
abcd
  • $ 锚定行尾,此字符前面的任意单个字符必须出现在行尾
[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf 
[root@lwq opt]# ls | grep "d$"
aaacd
abcd
bcd
  • ^$ 空白行
[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  d1.sh d2.sh
[root@lwq opt]# ls | grep "^d.*h$"
d1.sh
d2.sh
  • \ <或 \b 锚定词首,其后面的任意单个字符必须作为单词首部出现
  • \ >或 \ b锚定词尾,其后面任意单个字符必须作为单词尾部出现
[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf
[root@lwq opt]# ls | grep "\<a.d\>"
[root@lwq opt]# ls | grep "\<a.*d\>"
aaacd
abcd
[root@lwq abc]# ls | grep \ba.*d\b   (必须接单双引号)
[root@lwq abc]# ls | grep "\ba.*d\b"
aaacd
abcd

分组

  • \(\) 例如: \(ab\)*
  • 后向引用
    \1 引用第一个左括号以及与之对应的右括号所包括的所有内容
    \2 引用第二个左括号以及与之对应的右括号所包括的所有内容
[root@lwq lwq]# echo "liu wan qian"
liu wan qian
[root@lwq lwq]# echo "liu wan qian" | sed 's/liu wan qian/liu qian wan/g'
liu qian wan
[root@lwq opt]# echo "liu wan qian" | sed 's/liu \(wan\)* \(qian\)*/liu \2 \1/g'
liu qian wan

3.扩展正则表达式

字符匹配
egrep -o 只显示被匹配字段

  • . 匹配任意单个字符
[root@lwq lwq]# ls
a  aaabcc  aaabcd  abbbccc  abc  abcdfe  b  c  d  e  f  g  h
[root@lwq lwq]# ls | egrep '.|a*b'
a
aaabcc
aaabcd
abbbccc
abc
abcdfe
b
c
d
e
f
g
h
[root@lwq lwq]# ls | egrep '.|a*'
a
aaabcc
aaabcd
abbbccc
abc
abcdfe
b
c
d
e
f
g
h
  • []匹配指定范围内的任意单个字符
  • [^]匹配指定范围外任意单个字符

次数匹配

  • * 匹配其前面的任意单个字符任意次
    
  • ?匹配其前面的任意字符1次或0次
  • +匹配其前面的任意单个字符至少1次(两个字符必须挨在一起)
  • {m,n}匹配其前面的任意单个字符至少m次,之多n次

位置锚定

  • ^ 锚定行首,此字符后面的任意单个字符必须出现在行首
  • $ 锚定行尾,此字符前面的任意单个字符必须出现在行尾
  • ^$空白行
  • <或\b 锚定词首,其后面的任意单个字符必须作为单词首部出现
  • >或\b 锚定词尾,其前面的任意单个字符必须作为单词尾部出现

分组

  • () 分组
    \1,\2,\3,……
    例如: (ab)*

  • 后向引用

\1   引用第一个左括号以及与之对应的右括号所包括的所有内容
\2   引用第二个左括号以及与之对应的右括号所包括的所有内容

sed -r 表示引用扩展正则
sed -i 直接修改读取文件内容
grep -E = egrep 扩展正则

[root@lwq opt]# echo "liu wan qian" | sed -r 's/liu (wan)* (qian)*/liu \2 \1/g'
liu qian wan

[root@lwq lwq]# echo lan zhi yong | sed  's/lan \(.*\) \(.*\)/ lan \2 \1/g'
 lan yong zhi
[root@lwq lwq]# echo lan zhi yong | sed -r 's/lan (.*) (.*)/ lan \2 \1/g'
 lan yong zhi

或者

  • | or默认匹配 | 的整个左侧或者整个右侧的内容
[root@lwq opt]# touch c cat C Cat
[root@lwq opt]# ls 
C    Cat     c    cat  
[root@lwq lwq]# ls | egrep 'c|Cat'
c
cat
Cat
[root@lwq lwq]# ls | egrep -o 'c|Cat'
c
c
Cat
[root@lwq lwq]# ls | egrep -o '(c|C)at'
cat
Cat
[root@lwq lwq]# ls | egrep  '(c|C)at'
cat
Cat
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值