正则表达式
boolean matches(正则表达式):判断当前字符串是否匹配某个正则表达式
一、字符类
[abc]
:a
、b
或 c
(简单类)
[^abc]
:任何字符,除了 a
、b
或 c
(否定)
[a-zA-Z]
:a
到 z
或 A
到 Z
,两头的字母包括在内(范围)
二、元字符
正则表达式中预先定义好了一系列常用的字符类型
.
:任何字符(但不包含换行符)
\d
:数字:等同于[0-9]
\D
:非数字: [^0-9]
\s
:空白字符:[ \t\n\x0B\f\r]
\S
:非空白字符:[^\s]
\w
:单词字符:[a-zA-Z_0-9]
\W
:非单词字符:[^\w]
三、Greedy 数量词
数量词写在一个字符后面, 表示一个字符出现的次数, 注意 {n,m} n,后面不能有空格
X?
:X,一次或一次也没有
X*
:X,零次或多次
X+
:X,一次或多次
X{
n}
:X,恰好 n 次
X{
n,}
:X,至少 n 次
X{
n,
m}
:X,至少 n 次,但是不超过 m 次
四、逻辑运算符
XY:X 后跟 Y
X|
Y:X 或 Y
(
X)
:X,作为捕获组,(xx)?
表示匹配 xx 一次或一次都没有, 其他限定符同理。
五、边界匹配器
正则表达式中 ^表示开始,$表示结束,开始和结束的符号不可以省略。
^
表示匹配 以 后一个字符开头 或取反
1)匹配以指定字符开头 ^[a-zA-Z_]+\w 必须以小写字母、大写字母、下划线开头
2)用在[]内部用于取反 [^hz] 匹配不含有hz的字符
$ 表示匹配以 前一个字符结尾
\d$ 以数字结尾
^
:行的开头
$
:行的结尾