【概述】
Java中可使用Pattern和Matcher类来使用正则表达式。
Pattern对象是正则表达式编译后在内存中的表示形式。正则表达式必须先编译为Pattern对象,然后利用Pattern对象创建Matcher对象。执行匹配所涉及的状态保留在Matcher对象中,多个Matcher对象可共享同一Pattern对象。
【Matcher中方法详解】
Matcher类提供了几个常用方法:
boolean find():尝试查找与该模式匹配的输入序列的下一个子序列,当且仅当输入序列的子序列匹配此匹配器的模式时才返回 true。
boolean matches():将整个区域(整个字符串)与模式进行匹配,若成功返回true。
booean lookingAt():从区域(字符串)开头与模式进行匹配,若成功返回true。与String的startsWith()相似。
String group():返回上一次与Pattern匹配的字符串。
String group(int group):返回在以前匹配操作期间由给定组捕获的输入子序列。捕获组是从 1 开始从左到右的索引。组零表示整个模式,因此表达式 m.group(0) 等效于 m.group()。
int groupCount():返回此匹配器模式中的捕获组数。根据惯例,零组表示整个模式。它不包括在此计数中。
int start():返回上次与Pattern匹配的字串在目标字符串中的起始位置。
Int start(int group):返回在以前的匹配操作期间,由给定组所捕获的子序列的初始索引。捕获组是从 1 开始从左到右的索引。组零表示整个模式,因此表达式m.start(0)等效于m.start()。
int end():返回上次与Pattern匹配的字串在目标字符串中的结束位置+1。
int end(int group):返回在以前的匹配操作期间,由给定组所捕获子序列的最后字符之后的偏移量。捕获组是从 1 开始从左到右的索引。组零表示整个模式,因此表达式m.end(0)等效于m.end()。
Matcher reset():充值匹配器,将现有的Matcher对象应用于一个新的字符序列。
【示例1(用m.matches()实现与整个字符串匹配)】
运行结果:
【示例2(实现与子字符串匹配)】
运行结果:
【分组详解】
分组:就是用小括号来指定子表达式,你可以指定这个子表达式的重复字数,也可进行其它操作。
例如正则表达式:”whc(\\d\\d)(\\w+)”
分组数为2(即groupCount(),组0不计入分组数)
分组0(即group(0)或group()):”whc(\\d\\d)(\\w+)”
分组1(即group(1)):”(\\d\\d)”
分组2(即group(2)):”(\\w+)”
【示例3】
运行结果:
【String与正则】
boolean matches(String regex):判断该字符串是否与给定的正则表达式相匹配。
StringreplaceAll(String regex,String replacement):使用给定的 replacement 替换此字符串匹配了该正则表达式的所有子串。
StringreplaceFirst(String regex,String replacement):使用给定的 replacement 替换此字符串匹配了该正则表达式的第一个子串。
String[]split(String regex, int limit):根据给定分隔符来拆分此字符串为多个字串。