正则表达式
String regStr = "\\d\\d\\d\\d" ;
Pattern pattern = Pattern. compile(regStr);
Matcher matcher = pattern . matcher(content) ;
while (matcher . find()) {
System. out . printLn("找到:”+ matcher . group(0));
}
matcher.find()完成的任务
1.根据指定的规则,定位满足规则的子字符串
2.找到后,将子字符串的开始的索引记录到matcher对象的属性int[]groups;groups[0] = 起始位置 ,把该子字符串的结束的索引+1的值记录到groups[1]
3.同时记录oLdLast的值为子字符串的结束的索引+1的值,即下次执行find时,就从oLdLast 开始匹配
符号 | 含义 |
---|---|
[ ] | 可接收的字符列表 |
[^] | 不接收的字符列表 |
- | 连字符 |
. | 匹配除\n以外的任何宇符 |
\\d | 匹配单个数字字符,相当于[0-9] \d{3}(\ld)?包含3个或4个数字的字符串 |
\\D | 匹配单个非数字字符,相当于[^0-9] |
\\w | 匹配单个数字、大小写字母字符,相当于[0-9a-zA-Z] |
\\w | 匹配单个非数字、大小写宇母字符,相当于[^0-9a-zA-Z] |
\\s | 匹配任何空白字符,包括空格、制表符、换页符等 |
\\S | 匹配任何非空白字符 |
| | 匹配"I" 之前或之后的表达式 |
* | 指定字符重复0次或n次(无要求) |
+ | 指定字符重复1次或n次(至少 一次) |
? | 指定字符重复0次或1次(最多一次),非贪婪匹配 |
{n} | 只能输入n个字符 |
{n,} | |
{n,m} | 指定至少n个但不多于m个匹配 |
^ | 指定起始字符 |
$ | 指定结束字符 |
\\b | 匹配目标字符串的边界 |
\B | 匹配目标字符串的非边界 |
(pattern) | 非命名捕获。捕获匹配的子字符串。编号为零的第一个捕获是 由整个正则的字符串不能包含任何标点符号,并且不能以数字开头。可以使用单引号 |
(? pattern) | 命名捕获。将匹配的子字符串捕获到一个组名称或编号名称中。用于name(? pattern) |
(?:pattern) | 匹配pattern但不捕获该四配的子表达式,即它是一个非捕获匹配,不存储供以后使用的四配。这对于用”or"字符(|)组合模式部件的情况很有用。例如,'industr(?:y]lies) 是比’industrylindustries’更经济的表达式。 |
(?= pattern) | 它是一个非捕获四配。例如,'Windows (3=95|98|NT|2000)匹配"Windows 2000"中的"Windows",但不匹配"Windows 3.1"中的"Windows". |
(?!pattern) | 该表达式匹配不处于匹配pattern的字符串的起始点的搜索字符串。它是一个非捕获匹配。例如,'Windows (3195|98|NT|2000)匹配"Windows 3.1 “中的"Windows”,但不匹配"Windows 2000"中的"Windows"。 |