正则表达式通常用于判断语句,用来检查某一字符串是否满足某一格式
1、正则表达式的元字符
\d:0-9的任何一个数字
\D:任何一个非数字字符
\s:空白字符,如'\t'、'\n'
\S:非空白字符
\w:可用于标识的字符,但不包括'$’,可以理解为匹配数字、字母、下划线或者汉字,等价于[^a-zA-Z0-9_]
\W:不可用于标识的字符
\p{Lower}:小写字母a-z
\p{Upper}:大写字符A-Z
\p{ASCII}:ASCII字符
\p{Alpha}:字母字符
\p{Digit}:数字字符
\p{Alnum}:数字或字母字符
\p{Punct}:标点符号
\p{Graph}:可见字符,等价于标点符号+数字+字母,即[\p{Alnum}\p{Punct}]
\p{Print}:可打印字符
\p{Blank}:空格或制表符,等价于[\t]
\p{Cntrl}:控制字符
2、正则表达式可以使用方括号括起来若干个字符来表示一个元字符,例如:
[abc]4:代表a4、b4、c4这三个字符串都是与该正则表达式匹配的字符串
[^456]:代表4、5、6以外的的任何字符
[a-r]:代表a-r中的任意一个英文字母
[a-zA-Z]:代表任意一个英文字母
[a-e[g-z]]:代表a-e或者g-z的任意一个字母(并运算、也可以说或)
[a-o&&[def]]:代表d、e、f中任意一个字母(交运算,也可以说且)
[a-d&&[^bc]]:代表a、d
3、正则表达式允许使用限定修饰符来限定元字符出现次数
?:0次或者1次,例如A?,代表没有A或者1个A
*:0次或者多次,例如A*,代表有没有A都行
+:1次或者多次,例如A+,代表至少一个A
{n}:出现n次,例如A{2},代表A正好出现2次
{n,}:至少出现n次,例如A{2,},代表A至少出现2次
{n,m}:出现n-m次,例如A{2,4},代表A至少出现2次,最多出现4次