作用:通常用于判断语句中,用来判断某一字符串是否满足某一格式。
一、元字符
常见元字符如下:
元字符 | 正则表达式的写法 | 意义 |
. | . | 代表任意一个字符 |
某个字符 | 某个字符 | 代表某个字符 |
\d | 代表0-9的数字 | |
\D | 代表非数字字符 | |
\s | 代表空白字符,如\t,\n等 | |
\S | 代表非空白字符 | |
\w | \\w | 代表标识符 |
\W | \\W | 代表非标识符 |
\p{Lower} | \\p{Lower} | 代表小写字母 |
\p{Upper} | \\p{Upper} | 代表大写字母 |
\p{Alpha} | \\p{Alpha} | 代表字母 |
\p{Digit} | \\p{Digit} | 代表数字 |
\p{Alnum} | \\p{Alnum} | 代表数字或字母 |
\p{Punct} | \\p{Punct} | 代表标点字符 |
\p{Graph} | \\p{Graph} | 代表可见字符 |
\P{Cntrl} | \\P{Cntrl} | 代表控制字符 |
\p{Blank} | \\p{Blank} | 空格或制表符 |
\p{Print} | \\p{Print} | 可打印字符 |
\{ASCII} | \\{ASCII} | ASCII字符 |
二、自定义元字符
用方括号可以自定字符,并且可以用逻辑运算符
如:
[^456]——非运算,代表4、5、6之外的任意字符
[a-r]——代表a~r的任意一个字母
[a-zA-Z]——代表a~z或A~Z,可表示任意一个英文字母
[a-e[g-z]]——并运算,a~e或g~z的热河一个字符
[a-o&&[def]]——交运算
[a-d&&[^bc]]——差运算,代表字母a、d
三、用数字限定元字符出现的次数
限定修饰符 | 意义 | 实例 |
? | 0次或1次 | A? |
* | 0次或多次 | A* |
+ | 1次或多次 | A+ |
{n} | 刚好n次 | A{n} |
{n,} | 至少n次 | A{n,} |
{n,m} | n~m次 | A{n,m} |
注意:要限定的元字符A,最好用()括起来,容易理解
四、匹配正则表达式——matches()
定义正则表达式字符:Stringa =”正则表达式”
检验已知字符str是否匹配:str.matches(a)