正则表达式
1)用斜线格式构成元字符
元字符 | 在正则表达式中的写法 | 意义 |
. | . | 代表任何一个字符 |
\d | \\d | 代表0~9的任何一个数字 |
\D | \\D | 代表任何一个非数字字符 |
\s | \\s | 代表空格类字符,如回车、空格、缩进、换行 |
\S | \\S | 代表非空格类字符 |
\w | \\w | 代表可用于标识符的字符(不包括美元符号) |
\W | \\W |
代表不能用于标识符的字符
|
\p{Lower} | \\p{Lower} | 小写字母[a~z] |
\p{Upper} | \\p{Upper} | 大写字母[A~Z] |
\p{ASCII} | \\p{ASCII} | ASCII字符 |
\p{Alpha} | \\p{Alpha} | 字母 |
\p{Digit} | \\p{Digit} | 数字字符,即[0~9] |
\p{Alnum} | \\p{Alnum} | 字母或数字 |
2)用中括号格式构成的元字符
用方括号括起来若干个字符用来表示一个元字符,该元字符代表括号中的任何一个字符。
例如:
[abc]代表a、b、c中的任何一个。
[^abc]代表除了a、b、c以外的任何字符。
[a-zA-Z]代表英文字母(包括大写和小写中的任何一个)。
[a-d]代表a~d中的任何一个。
另外,中括号还允许嵌套中括号,可以进行并、交、差运算。
例如:
[a-d[m-p]]代表a~d,或m~p中的任何字符(并)。
[a-z&&[def]]代表d、e或f中的任何一个(交)。
[a-f&&[^bc]]代表a、d、e、f(差)。
3)元字符的修饰符
带限定符号的模式 | 意义 | 带限定符号的模式 | 意义 |
X? | X出现0次或1次 | X{n,} | X至少出现n次 |
X* | X出现0次或多次 | X{n,m} |
X出现n次至m次
|
X+ | X出现1次或多次 | XY | X的后缀是Y |
X{n} | X恰好出现n次 | X|Y | X或Y |