正则表达式
目录
正则表达式分类
正则表达式:REGEXP,REGular EXPression。
正则表达式分为两类:
Basic REGEXP(基本正则表达式)
Extended REGEXP(扩展正则表达式)
元字符
. //任意单个字符
[] //匹配指定范围内的任意单个字符
[^] //匹配指定范围外的任意单个字符
//任意单个字符
[root@localhost ~]# ls | grep '^.$'
a
b
c
//匹配指定范围内的任意单个字符
[root@localhost ~]# ls | grep '^[a-c]$'
a
b
c
[root@localhost ~]# ls | grep '^[-1-9a-c-]$'
1
2
3
4
5
6
7
8
9
a
b
c
[root@localhost ~]# ls | grep '^[-19a-c-]$'
1
9
a
b
c
//匹配指定范围外的任意单个字符
[root@localhost ~]# ls | grep '^[^1-5]$'
6
7
8
9
a
b
c
[root@localhost ~]# ls | grep '^[1-6^]$'
1
2
3
4
5
6
//^放在开始位置表示取反,其它任何位置都是表示其本身,取反就是除了指定范围内的值其它的都可以显示。
匹配次数(贪婪模式)
* //匹配其前面的任意单个字符任意次
.* //任意长度的任意字符
\? //匹配其前面的任意单个字符1次或0次
\+ //匹配其前面的任意单个字符至少1次
\{m,n\} //匹配其前面的任意单个字符至少m次,至多n次
//匹配其前面的任意单个字符任意次
[root@localhost ~]# ls | grep '^a*b*c*$'
a
aaaabc
aaabbbbccc
aabbc
ab
abbbbbbc
abc
abcc
abccccc
b
c
[root@localhost ~]# ls | grep '^abc*$'
ab
abc
abcc
abccccc
//任意长度的任意字符
[root@localhost ~]# ls | grep '^a.*$'
a
aaaabc
aaabbbbccc
aabbc
ab
abbbbbbc
abc
abcc
abccccc
//匹配其前面的任意单个字符1次或0次
[root@localhost ~]# ls | grep '^ab\?$'
a
ab
//匹配其前面的任意单个字符至少m次,至多n次
[root@localhost ~]# ls | grep '^ab\{1,4\}$'
ab
abb
abbb
abbbb
位置锚定
^ //锚定行首,此字符后面的任意单个字符必须出现在行首
$ //锚定行尾,此字符前面的任意单个字符必须出现在行尾
^$ //空白行
\<或\b //锚定词首,其后面的任意单个字符必须作为单词首部出现
\>或\b //锚定词尾,其前面的任意单个字符必须作为单词尾部出现
//空白行
[root@localhost ~]# cat wrq
hello world hello james hello bryant
hello zzh
//匹配空白行
[root@localhost ~]# egrep ^$ wrq
//-v取反
[root@localhost ~]# egrep -v ^$ wrq
hello world hello james hello bryant
hello zzh
//锚定词首,其后面的任意单个字符必须作为单词首部出现
//锚定词尾,其前面的任意单个字符必须作为单词尾部出现
分组
\(\)
例:\(ab\)*
//后向引用
\1 //引用第一个左括号以及与之对应的右括号所包括的所有内容
\2 //引用第二个左括号以及与之对应的右括号所包括的所有内容
[root@localhost ~]# sed -r 's/(hello) (.*) (.*)/\3 \1 \2/' wrq
bryant hello world hello james hello
hellohellohello hello zzh