正则表达式

最新推荐文章于 2023-03-07 21:13:23 发布

StevenSu001

最新推荐文章于 2023-03-07 21:13:23 发布

阅读量358

点赞数

元字符是用来阐释字符表达式意义的字符，简言之，就是用来描述字符的字符。

正则表达式RE（Regular Expression）是由一串字符和元字符构成的字符串。

正则表达式的主要功能是文本查询和字符串操作，它可以匹配文本的一个字符或字符集合。实际上正则表达式完成了数据的过滤，将不满足正则表达式定义的数据拒绝掉，剩下与正则表达式匹配的数据。

基本的正则表达式元字符集合及其意义

1.“*”符号

zha*ng ：“*”前面的普通字符是a，就表示匹配a字符0次或多次，如：zhng、zhang、zhaaaang

（根据测试可以不包括前面的字符，即匹配0次）

2.匹配空行

匹配行首的^和匹配行尾的$组合起来“^$”可以用来匹配空行，如果需要匹配只包含一个字符的行，可以用“^.$”

3."[]"符号

匹配字符集合，支持穷举方法列出字符集合的所有元素，也支持使用“-”符号表示字符集合范围。

[12345] 等价于 [1-5]

我们知道“^”符号表示匹配行首，但是，“^”符号放到“[]”符号中就不再表示匹配行首了，而是表示取反符号。

[^b-d] :表示不再b~d范围内的字符

[A-Za-z] [A-Za-z]* :匹配任意英文单词

扩展的正则表达式元字符及其意义

1.“？”符号

（根据测试可以不包括前面的字符，即匹配0次）

2."()"符号和“|”符号

"()"符号和“|”符号通常结合使用，表示一组可选字符的集合。

re(a|b|c)d 等价于 re[abc]d

"|"符号也可以表示多个正则表达式的“或”关系。

grep -E “zha？ng|zhi” 文件