目录
正则表达式
前言
名词解释:
正则表达式(regular expression, RE)是一种字符模式,用于在查找过程中匹配指定的字符。
在大多数程序里,正则表达式都被置于两个正斜杠之间;例如/l[oO]ve/就是由正斜杠界定的正则表达式,
它将匹配被查找的行中任何位置出现的相同模式。在正则表达式中,元字符是最重要的概念。
工具
被vim、sed、awk、grep调用
场景
mysql、oracle、php、python ,Apache,Nginx... 需要正则
提示
//?在shell中表示一个字符,shell不区分大小写
元字符
定义:元字符是这样一类字符,它们表达的是不同于字面本身的含义
分类:基本正则表达式元字符和扩展正则表达式元字符
基本正则表达式元字符
^ 行首定位符
[root@localhost ~]# grep "root" /etc/passwd
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
[root@localhost ~]# grep "^root" /etc/passwd
为什么什么少一行?
root:x:0:0:root:/root:/bin/bash
$ 行尾定位符
love$
. 匹配任意单个字符
[root@localhost ~]# grep abc 1.txt
abc
[root@localhost ~]# grep adc 1.txt
adc
[root@localhost ~]# grep a.c 1.txt
abc
adc
* 匹配前导符0到多次
[root@localhost ~]# cat 1.txt
a
ab
abc
abcd
abcde
abcdef
ggg
hhh
iii
[root@localhost ~]# grep "abc*" 1.txt
ab
abc
abcd
abcde
abcdef
[root@localhost ~]# grep "abcd*" 1.txt
abc
abcd
abcde
abcdef
.* 任意多个字符
[root@localhost ~]# grep ".*" 1.txt
a
ab
abc
abcd
abcde
abcdef
ggg
hhh
iii
[ ] 匹配指定范围内的一个字符
[lL]ove
[ - ] 匹配指定范围内的一个字符,连续的范围
[a-z0-9]ove //[a-Z]=[a-zA-Z]
[^] 匹配不在指定组内的字符
[^a-z0-9]ove //取反
[root@localhost~]# cat 1.txt
love
1ove
|ove
[root@localhost~]# grep [0-9a-Z]ove 1.txt
love
1ove
[root@localhost ~]# grep [^0-9a-Z]ove 1.txt
|ove
\ 用来转义元字符 ('' "" \),脱意符
[root@localhost ~]# grep "l." 1.txt
love
l.ve
[root@localhost ~]# grep "l\." 1.txt
l.ve
\< 词首定位符
[root@localhost ~]# grep "love" 1.txt
love
iloveyou
[root@localhost ~]# grep "\<love" 1.txt
love
\> 词尾定位符
love\>
() \(..\) 匹配稍后使用的字符的标签
:% s/172.16.130.1/172.16.130.5/
:% s/\(172.16.130.\)1/\15/
:% s/\(172.\)\(16.\)\(130.\)1/\1\2\35/
:3,9 s/\(.*\)/#\1/ 加注释
x\{m\} 字符x重复出现m次
[root@localhost ~]# grep o 1.txt
love
loove
looove
[root@localhost ~]# grep "o\{3\}" 1.txt
looove
x\{m,\} 字符x重复出现m次以上
o\{5,\}
x\{m,n\} 字符x重复出现m到n次
o\{5,10\}
[root@localhost ~]# egrep "o{4,5}" 1.txt
oooo
ooooo
ioooo
ooooi
iooooi
[root@localhost ~]# egrep "o{5,5}" 1.txt
ooooo
扩展正则表达式元字符(egrep )
+匹配1~n个前导字符
[root@localhost ~]# cat 1.txt
lve
love
loove
[root@localhost ~]# egrep lo+ve 1.txt
love
loove
?匹配0~1个前导字符
lo?ve :?前面的o 有还是没有,都行!
[root@localhost ~]# egrep lo?ve tom.sh
love
lve
a|b 匹配a或b
[root@localhost ~]# egrep "o|v" 1.txt
lve
1ove
loove
looove
loeve
love
Love
iloveyou
l.ve
o
oo
ooo
oooo
ooooo
ioooo
ooooi
iooooi
()组字符
[root@localhost ~]# egrep "loveable|rs" 1.txt
rs
loveable
lovers
[root@localhost ~]# egrep "love(able|rs)" 1.txt
loveable
lovers
示例1
grep love 1.txt //找love
/^love/ //以love开头
/love$/ //以love结尾
/l.ve/ //l开始,一个任意字符,ve结尾
/lo*ve/ //l开始,零个或多个o,ve结尾
/[Ll]ove/ //大L 或者小L 开头的 ove
/love[a-z]/ //love最后一个小写字母
/love[^a-zA-Z0-9]/ //love最后一个(不是字母或者数字),而是符号
示例2
/.*/ //所有行
/^$/ //空行
/^[A-Z]..$/ //开头一个大写,最后2个任意字符
/^[A-Z][a-z ]*3[0-5]/ //一个大写开头,0到多个小写或空格,3,最后是0-5的一个数字
/[a-z]*\./ //0到多个小写字母,最后一个点
/^ *[A-Z][a-z][a-z]$/ //0到多个空格开头,一个大写,一个小写,再一个小写结尾
/^[A-Za-z]*[^,][A-Za-z]*$/ //0到多个字母开头,非逗号,0到多个英文结尾
/\<fourth\>/ //找个单词
/\<f.*th\>/ //找单词
/5{2}2{3}\./ //5两次2三次和一个点
/^[ \t]*$/ //0到多个 ,空格或tab的行
/^#/ //井号开头的行
/^[ \t]*#/ //有0到多个,空格或者tab开头的行,的注释行
:1,$ s/\([Oo]ccur\)ence/\1rence/ // 多个r
:1,$ s/\(square\) and \(fair\)/\2 and \1/ //换个位置