正则表达式定义了字符串的模式,用来搜索、编辑或处理文本。
一个字符串其实就是一个简单的正则表达式,例如 Hello World 正则表达式匹配 "Hello World" 字符串。
.(点号)也是一个正则表达式,它匹配任何一个字符如:"a" 或 "1"。
java.util.regex 包主要包括以下三个类:
Pattern 类 | pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。 通过调用其公共静态编译方法,可返回一个 Pattern 对象。 该方法接受一个正则表达式作为它的第一个参数 |
Matcher 类 | Matcher 对象是对输入字符串进行解释和匹配操作的引擎。 Matcher 没有公共构造方法。 调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象 |
PatternSyntaxException | 一个非强制异常类,它表示一个正则表达式模式中的语法错误 |
this is text | 匹配字符串 "this is text" |
this\s+is\s+text | \s+ 匹配this的 \s+ ,可以匹配多个空格, 匹配 is的\s+ 可以匹配多个空格 然后再跟上 text 字符串。 this is text可以匹配 |
^\d+(\.\d+)? | ^ 定义了以什么开始 \d+ 匹配一个或多个数字 \. 匹配 "." ? 设置括号内的选项是可选的 "5", "1.5" 和 "2.21"可以匹配 |
\\ | 要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义 n匹配字符 n \n 匹配换行符 序列 \\\\ 匹配 \\ ,\\( 匹配 ( |
\\d | 表示一位数字 |
^ | 匹配输入字符串开始的位置 |
$ | 匹配输入字符串结尾的位置 |
* | 零次或多次匹配前面的字符或子表达式 例如,zo* 匹配"z"和"zoo" * 等效于 {0,} |
+ | 一次或多次匹配前面的字符或子表达式 例如,"zo+"与"zo"和"zoo"匹配,但与"z"不匹 + 等效于 {1,} |
? | 零次或一次匹配前面的字符或子表达式 例如,"do(es)?"匹配"do"或"does"中的"do" ? 等效于 {0,1}。 |
{n} | n 是非负整数。正好匹配 n 次 例如,"o{2}"与"Bob"中的"o"不匹配 但与"food"中的两个"o"匹配。 |
{n,} | n 是非负整数。至少匹配 n 次 例如,"o{2,}"不匹配"Bob"中的"o" 而匹配"foooood"中的所有 o "o{1,}"等效于"o+" "o{0,}"等效于"o*"。 |
{n,m} | m 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次 例如,"o{1,3}"匹配"fooooood"中的头三个 o 'o{0,1}' 等效于 'o?' 注意:您不能将空格插入逗号和数字之间。 |
? | 当此字符紧随任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式是"非贪心的"。 "非贪心的"模式匹配搜索到的、尽可能短的字符串, 而默认的"贪心的"模式匹配搜索到的、尽可能长的字符串。 例如,在字符串"oooo"中,"o+?"只匹配单个"o",而"o+"匹配所有"o"。 |
. | 匹配除"\r\n"之外的任何单个字符 若要匹配包括"\r\n"在内的任意字符,请使用诸如"[\s\S]"之类的模式。 |
\d | 数字字符匹配。等效于 [0-9]。 |
\D | 非数字字符匹配。等效于 [^0-9]。 |
\f | 换页符匹配。等效于 \x0c 和 \cL。 |
\n | 换行符匹配。等效于 \x0a 和 \cJ。 |
\r | 匹配一个回车符。等效于 \x0d 和 \cM。 |