正则表达式

最新推荐文章于 2020-05-24 07:48:33 发布

Lu鹿夫人

最新推荐文章于 2020-05-24 07:48:33 发布

阅读量164

点赞数

本文链接：https://blog.csdn.net/weixin_44504261/article/details/94360641

版权

正则表达式

1.正则表达式分类

正则表达式分为两类：
基本正则表达式
扩展正则表达式

2.基本正则表达式

元字符

. 任意单个字符

[root@lwq opt]# ls
 aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "a."
aa
aaacd
ab
abcd
[root@lwq opt]# ls | grep "a.."
aaacd
abcd

[] 匹配指定范围内任意单个字符

[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep [b]
ab
abcd
bcd
bcf
[root@lwq opt]# ls | grep [a-c]
aa
aaacd
ab
abcd
bcd
bcf

[^] 匹配指定范围外任意单个字符
^指取反

[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep [^a-c]
aaacd
abcd
bcd
bcf

匹配次数（贪婪模式）

*  匹配其前面的任意单个字符任意次

[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "ab*"
aa
aaacd
ab
abcd

.* 任意长度的任意字符

[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "a.*d"
aaacd
abcd
[root@lwq opt]# ls | grep ".*c"
aaacd
abcd
bcd
bcf
[root@lwq opt]# ls | grep ".*"
aa
aaacd
ab
abcd
bcd
bcf

\ ？匹配其前面的任意单个字符1次或0次

[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "a\?c"
aaacd
abcd
bcd
bcf

\ + 匹配其前面的任意单个字符至少1次

[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "a\+c"
aaacd
[root@lwq opt]# ls | grep "a\+b"
ab
abcd

\ {m,n}匹配其前面的任意单个字符至少m次，至多n次

[root@lwq opt]# ls
 aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "a\{1,3\}b"
ab
abcd
[root@lwq opt]# ls | grep "a\{1,3\}c"
aaacd

位置锚定

^ 锚定行首，此字符后面的任意单个字符必须出现在行首

[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  
[root@lwq opt]# ls | grep "^a"
aa
aaacd
ab
abcd

$ 锚定行尾，此字符前面的任意单个字符必须出现在行尾

[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf 
[root@lwq opt]# ls | grep "d$"
aaacd
abcd
bcd

^$ 空白行

[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf  d1.sh d2.sh
[root@lwq opt]# ls | grep "^d.*h$"
d1.sh
d2.sh

\ <或 \b 锚定词首，其后面的任意单个字符必须作为单词首部出现
\ >或 \ b锚定词尾，其后面任意单个字符必须作为单词尾部出现

[root@lwq opt]# ls
aa  aaacd  ab  abcd  bcd  bcf
[root@lwq opt]# ls | grep "\<a.d\>"
[root@lwq opt]# ls | grep "\<a.*d\>"
aaacd
abcd
[root@lwq abc]# ls | grep \ba.*d\b   (必须接单双引号)
[root@lwq abc]# ls | grep "\ba.*d\b"
aaacd
abcd

分组

\（\）例如： \（ab\）*
后向引用
\1 引用第一个左括号以及与之对应的右括号所包括的所有内容
\2 引用第二个左括号以及与之对应的右括号所包括的所有内容

[root@lwq lwq]# echo "liu wan qian"
liu wan qian
[root@lwq lwq]# echo "liu wan qian" | sed 's/liu wan qian/liu qian wan/g'
liu qian wan

[root@lwq opt]# echo "liu wan qian" | sed 's/liu \(wan\)* \(qian\)*/liu \2 \1/g'
liu qian wan

3.扩展正则表达式

字符匹配
egrep -o 只显示被匹配字段

. 匹配任意单个字符

[root@lwq lwq]# ls
a  aaabcc  aaabcd  abbbccc  abc  abcdfe  b  c  d  e  f  g  h
[root@lwq lwq]# ls | egrep '.|a*b'
a
aaabcc
aaabcd
abbbccc
abc
abcdfe
b
c
d
e
f
g
h
[root@lwq lwq]# ls | egrep '.|a*'
a
aaabcc
aaabcd
abbbccc
abc
abcdfe
b
c
d
e
f
g
h

[]匹配指定范围内的任意单个字符
[^]匹配指定范围外任意单个字符

次数匹配

* 匹配其前面的任意单个字符任意次

？匹配其前面的任意字符1次或0次
+匹配其前面的任意单个字符至少1次（两个字符必须挨在一起)
{m,n}匹配其前面的任意单个字符至少m次，之多n次

位置锚定

^ 锚定行首，此字符后面的任意单个字符必须出现在行首
$ 锚定行尾，此字符前面的任意单个字符必须出现在行尾
^$空白行
<或\b 锚定词首，其后面的任意单个字符必须作为单词首部出现
>或\b 锚定词尾，其前面的任意单个字符必须作为单词尾部出现

分组

（）分组
\1,\2,\3,……
例如：（ab）*
后向引用

\1   引用第一个左括号以及与之对应的右括号所包括的所有内容
\2   引用第二个左括号以及与之对应的右括号所包括的所有内容

sed -r 表示引用扩展正则
sed -i 直接修改读取文件内容
grep -E = egrep 扩展正则

[root@lwq opt]# echo "liu wan qian" | sed -r 's/liu (wan)* (qian)*/liu \2 \1/g'
liu qian wan

[root@lwq lwq]# echo lan zhi yong | sed  's/lan \(.*\) \(.*\)/ lan \2 \1/g'
 lan yong zhi
[root@lwq lwq]# echo lan zhi yong | sed -r 's/lan (.*) (.*)/ lan \2 \1/g'
 lan yong zhi

或者

| or默认匹配 | 的整个左侧或者整个右侧的内容

[root@lwq opt]# touch c cat C Cat
[root@lwq opt]# ls 
C    Cat     c    cat  
[root@lwq lwq]# ls | egrep 'c|Cat'
c
cat
Cat
[root@lwq lwq]# ls | egrep -o 'c|Cat'
c
c
Cat
[root@lwq lwq]# ls | egrep -o '(c|C)at'
cat
Cat
[root@lwq lwq]# ls | egrep  '(c|C)at'
cat
Cat

Lu鹿夫人

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式

正则表达式1.正则表达式分类正则表达式分为两类：基本正则表达式扩展正则表达式2.基本正则表达式元字符. 任意单个字符[root@lwq opt]# ls aa aaacd ab abcd bcd bcf [root@lwq opt]# ls | grep "a."aaaaacdababcd[root@lwq opt]# ls | grep "a.."...
复制链接

扫一扫