正则表达式
1.正则表达式分类
正则表达式分为两类:
基本正则表达式
扩展正则表达式
2.基本正则表达式
元字符
- . 任意单个字符
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep "a."
aa
aaacd
ab
abcd
[root@lwq opt]# ls | grep "a.."
aaacd
abcd
- [] 匹配指定范围内任意单个字符
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep [b]
ab
abcd
bcd
bcf
[root@lwq opt]# ls | grep [a-c]
aa
aaacd
ab
abcd
bcd
bcf
- [^] 匹配指定范围外任意单个字符
^指取反
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep [^a-c]
aaacd
abcd
bcd
bcf
匹配次数(贪婪模式)
-
* 匹配其前面的任意单个字符任意次
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep "ab*"
aa
aaacd
ab
abcd
- .* 任意长度的任意字符
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep "a.*d"
aaacd
abcd
[root@lwq opt]# ls | grep ".*c"
aaacd
abcd
bcd
bcf
[root@lwq opt]# ls | grep ".*"
aa
aaacd
ab
abcd
bcd
bcf
- \ ?匹配其前面的任意单个字符1次或0次
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep "a\?c"
aaacd
abcd
bcd
bcf
- \ + 匹配其前面的任意单个字符至少1次
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep "a\+c"
aaacd
[root@lwq opt]# ls | grep "a\+b"
ab
abcd
- \ {m,n}匹配其前面的任意单个字符至少m次,至多n次
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep "a\{1,3\}b"
ab
abcd
[root@lwq opt]# ls | grep "a\{1,3\}c"
aaacd
位置锚定
- ^ 锚定行首,此字符后面的任意单个字符必须出现在行首
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep "^a"
aa
aaacd
ab
abcd
- $ 锚定行尾,此字符前面的任意单个字符必须出现在行尾
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep "d$"
aaacd
abcd
bcd
- ^$ 空白行
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf d1.sh d2.sh
[root@lwq opt]# ls | grep "^d.*h$"
d1.sh
d2.sh
- \ <或 \b 锚定词首,其后面的任意单个字符必须作为单词首部出现
- \ >或 \ b锚定词尾,其后面任意单个字符必须作为单词尾部出现
[root@lwq opt]# ls
aa aaacd ab abcd bcd bcf
[root@lwq opt]# ls | grep "\<a.d\>"
[root@lwq opt]# ls | grep "\<a.*d\>"
aaacd
abcd
[root@lwq abc]# ls | grep \ba.*d\b (必须接单双引号)
[root@lwq abc]# ls | grep "\ba.*d\b"
aaacd
abcd
分组
- \(\) 例如: \(ab\)*
- 后向引用
\1 引用第一个左括号以及与之对应的右括号所包括的所有内容
\2 引用第二个左括号以及与之对应的右括号所包括的所有内容
[root@lwq lwq]# echo "liu wan qian"
liu wan qian
[root@lwq lwq]# echo "liu wan qian" | sed 's/liu wan qian/liu qian wan/g'
liu qian wan
[root@lwq opt]# echo "liu wan qian" | sed 's/liu \(wan\)* \(qian\)*/liu \2 \1/g'
liu qian wan
3.扩展正则表达式
字符匹配
egrep -o 只显示被匹配字段
- . 匹配任意单个字符
[root@lwq lwq]# ls
a aaabcc aaabcd abbbccc abc abcdfe b c d e f g h
[root@lwq lwq]# ls | egrep '.|a*b'
a
aaabcc
aaabcd
abbbccc
abc
abcdfe
b
c
d
e
f
g
h
[root@lwq lwq]# ls | egrep '.|a*'
a
aaabcc
aaabcd
abbbccc
abc
abcdfe
b
c
d
e
f
g
h
- []匹配指定范围内的任意单个字符
- [^]匹配指定范围外任意单个字符
次数匹配
-
* 匹配其前面的任意单个字符任意次
- ?匹配其前面的任意字符1次或0次
- +匹配其前面的任意单个字符至少1次(两个字符必须挨在一起)
- {m,n}匹配其前面的任意单个字符至少m次,之多n次
位置锚定
- ^ 锚定行首,此字符后面的任意单个字符必须出现在行首
- $ 锚定行尾,此字符前面的任意单个字符必须出现在行尾
- ^$空白行
- <或\b 锚定词首,其后面的任意单个字符必须作为单词首部出现
- >或\b 锚定词尾,其前面的任意单个字符必须作为单词尾部出现
分组
-
() 分组
\1,\2,\3,……
例如: (ab)* -
后向引用
\1 引用第一个左括号以及与之对应的右括号所包括的所有内容
\2 引用第二个左括号以及与之对应的右括号所包括的所有内容
sed -r 表示引用扩展正则
sed -i 直接修改读取文件内容
grep -E = egrep 扩展正则
[root@lwq opt]# echo "liu wan qian" | sed -r 's/liu (wan)* (qian)*/liu \2 \1/g'
liu qian wan
[root@lwq lwq]# echo lan zhi yong | sed 's/lan \(.*\) \(.*\)/ lan \2 \1/g'
lan yong zhi
[root@lwq lwq]# echo lan zhi yong | sed -r 's/lan (.*) (.*)/ lan \2 \1/g'
lan yong zhi
或者
- | or默认匹配 | 的整个左侧或者整个右侧的内容
[root@lwq opt]# touch c cat C Cat
[root@lwq opt]# ls
C Cat c cat
[root@lwq lwq]# ls | egrep 'c|Cat'
c
cat
Cat
[root@lwq lwq]# ls | egrep -o 'c|Cat'
c
c
Cat
[root@lwq lwq]# ls | egrep -o '(c|C)at'
cat
Cat
[root@lwq lwq]# ls | egrep '(c|C)at'
cat
Cat