参考文章:神秘的正则表达式
参考书籍:java编程思想(第四版)
正则表达式的定义:一般来说,正则表达式就是以某种方式来描述字符串。因此你可以说,“一个字符串如果有这些东西,他就是我要找的东西。”
正则表达式是一种强大而灵活的文本处理工具,使用正则表达式我们可以以编程的方式,构造复杂的文本模式,并且对输入的字符串进行搜索。一旦找到了匹配这些模式的部分,你就可以随心所欲的对他们进行处理。(摘自 java编程思想)
表一:
代码 | 解释 |
---|---|
\b | 匹配单词的开始或结束 |
. | 匹配除换行符以外的任意字符 |
\d | 匹配数字 |
\w | 匹配字母或数字或下划线或汉字 |
^ | 匹配字符串的开始 |
$ | 匹配字符串的结束 |
\s | 匹配任意的空白符 |
* | 重复零次或更多次 |
+ | 重复一次或更多次 |
? | 重复零次或一次 |
{n} | 重复n次 |
{n,m} | 重复n次到m次 |
\W | 匹配任意不是字母,数字,下划线,汉字的字符 |
\S | 匹配任意不是空白符的字符 |
\D | 匹配任意非数字的字符 |
\B | 匹配不是单词开头或结束的位置 |
[^A] | 匹配除了A以外的任意字符 |
[^ABCDE] | 匹配除了ABCDE这几个字母以外的任意字符 |
*? | 重复任意次,但尽可能少重复 |
+? | 重复1次或更多次,但尽可能少重复 |
?? | 重复0次或1次,但尽可能少重复 |
{n,m}? | 重复n到m次,但尽可能少重复 |
{n,}? | 重复n次以上,但尽可能少重复 |
表二
B | 指定字符B |
\xhh | 十六进制值为0xhh的字符 |
\xhhhh | 十六进制值为0xhhhh的字符 |
\t | 制表符 Tab |
]n | 换行符 |
\r | 回车 |
\f | 换页 |
\e | 转义(Escape) |
[abc] | 包含a、b、c中的任何字符(与a | b | c意义相同) |
[^abc] | 包含a、b、c 以外的任意字符(否定) |
[a-zA-Z] | a到z,A-Z之间的任一字符 |
[abc[hij]] | 包含a、b、c、h、i、j中的任意字符 |
[a-z&&[hij]] | h、i、j中的任意一个(取交) |
下面举三个小例子,引入正则表达式的用法:
1.整数匹配:
public class IntegerMatch {
public static void main(String[] args) {
/*
* ?:代表重复零次或一次,所以 -?表示可能以 “-”或者没有符号开头
* +:代表重复一次或多次
* \d:代表匹配数字
* "-?\\d+" :表示一个一位或多位的整数