在这一节中,介绍元字符的概念,通过使用元字符,可以高效地来表达我们熟知的数字、字母、操作符等。
空白操作元字符
[\b]
回退一个字符
\f
换页符
\n
换行符
\r
回车符
\t
制表符
根据上图显示,正则表达式匹配到了全文字符中的所有空行。
这里要指出\r\n
匹配Windows一个回车+换行的组合,表示使用的文本行结束标签。而Unix/Linux上匹配空白行使用\n\n
。
数字元字符
\d
任何一个数字字符
\D
任何一个非数字字符
根据上图显示,正则表达式匹配到了全文字符中的所有数字字符。
根据上图显示,正则表达式匹配到了全文字符中的所有非数字字符,包括字母、空格、空行等字符。
字母数字元字符
\w
匹配任何一个字母数字元素,包括大写和小写。以及下划线。
\W
匹配任何一个非字母数字以及非下划线的字符。
根据上图显示,正则表达式匹配到了全文字符中的所有字母数字字符,以及最后一行添加的下划线。
根据上图显示,正则表达式匹配到了全文字符中的除字母数字字符、下划线外的其他字符,如空行、小数点、空格等非字母数字下划线字符。
空白字符元字符
\s
匹配任何一个空白字符
\S
匹配任何一个非空白字符
根据上图显示,正则表达式匹配到了全文字符中的所有空白字符。包括换行符、空格。
根据上图显示,正则表达式匹配到了全文字符中的所有的非空白字符。包括字母、数字、小数点,以及下划线。
十六进制值与八进制值
在正则表达式中,十六进制数值要使用前缀 \x
来给出。
如 \x0A
表示ASCII字符10,也就是换行符\n
在正则表达式中,八进制数值要使用前缀 \0
来给出。
如 \011
表示ASCII字符9,也就是制表符\t
本节测试用例
cat
category
cat. X 10.9 Maverick
cat X 10.10 Yosemite
cat1 X 10.10 Yosemite
cat2 X 10.10 Yosemite
Cat X 10.11 A Capita
category 10.12 Sierra
Category 10.13 Moj_
「参考」
《正则表达式必知必会》