上面一节中我们了解了character classes的相关内容,这一节,我们了解一下一些Pattern里面预定义的character classes.
这些预定义的character classes主要用来简化和方便我们使用character classes, 把一些通用的提取处理。
1. 预定义Character Classes
Construct | Description | 翻译 |
---|---|---|
. | Any character (may or may not match line terminators) | 任何字符(包括或者不包括行终结符) |
\d | A digit: [0-9] | 一个数字, 对应character classes表示: [0-9] |
\D | A non-digit: [^0-9] | 非数字,对应character classes表示: [^0-9] |
\s | A whitespace character: [ \t\n\x0B\f\r] | 空白字符,对应character classes表示: [ \t\n\x0B\f\r] |
\S | A non-whitespace character: [^\s] | 非空白字符, 对应character classes表示为:[^\s] |
\w | A word character: [a-zA-Z_0-9] | 一个单词,对应character classes表示为: [a-zA-Z_0-9] |
\W | A non-word character: [^\w] | 非单词,对应character classes表示为:[^\w] |
constructs以\
开头的被称为转义构造(escaped constructs),如果你想这些预定义的字符串作为普通的字符串,则需要进行转义.