id | regex | 匹配 |
---|---|---|
1 | [abc] | a、b 或 c(简单类) |
2 | [^abc] | 除了 a、b 或 c(否定) |
3 | [a-zA-Z] | 在a 到 z 或 A 到 Z,两头的字母包括在内(范围的字符) |
4 | [a-d[m-p]] | 在a 到 d 或 m 到 p:[a-dm-p](并集)的字符 |
5 | [a-z&&[def]] | d、e 或 f(交集) |
6 | [a-z&&[^bc]] | a 到 z,除了 b 和 c:[ad-z](减去) |
7 | [a-z&&[^m-p]] | a 到 z,而非 m 到 p:[a-lq-z](减去) |
8 | [a-zA-Z0-9]+ | 匹配多个字符 |
9 | \d | 数字:[0-9] |
10 | \D | 非数字: [^0-9] |
11 | \s | 空白字符:[ \t\n\x0B\f\r] |
12 | \S | 非空白字符:[^\s] |
13 | \w | 单词字符:[a-zA-Z_0-9] |
14 | \W | 非单词字符:[^\w] |
在正则表达式中,用()来捕获组,每个组都有一个编号,编号从1开始,组零始终代表整个表达式。捕获的子序列稍后可以通过\n( Back 引用,n为组的编号)在表达式中使用。例如可以用"(.)\\1+"
对字符串进行叠词切割,其中"."
表示可以匹配任意字符,(.)
用来捕获组,\\1
用来获取捕获的子序列,+
表示一个或多个。
持续补充中······