这篇文章总结java1.4之后加入的正则表达式,总结他的使用。更多的源代码请访问我的github:https://github.com/yangsheng20080808/deepIntoJava
本文分为3大部分
- 正则表达式的通用定义规则
- 正则表达式定义的例子
- 附加常用的匹配例子
正则表达式的通用定义规则
使用正则表达式我们只要关心一个类即可:java.util.regex.Pattern
摘抄自官方API文档。
指定为字符串的正则表达式必须首先被编译为此类的实例。然后,可将得到的模式用于创建 Matcher 对象,依照正则表达式,该对象可以与任意字符序列匹配。执行匹配所涉及的所有状态都驻留在匹配器中,所以多个匹配器可以共享同一模式。
因此,典型的调用顺序是
Pattern p = Pattern.compile(“a*b”);
Matcher m = p.matcher(“aaaaab”);
boolean b = m.matches();
在仅使用一次正则表达式时,可以方便地通过此类定义 matches 方法。此方法编译表达式并在单个调用中将输入序列与其匹配。
语句 boolean b = Pattern.matches(“a*b”, “aaaaab”);
等效于上面的三个语句,尽管对于重复的匹配而言它效率不高,因为它不允许重用已编译的模式。
此类的实例是不可变的,可供多个并发线程安全使用。Matcher 类的实例用于此目的则不安全。
匹配器和分组上一篇文章已经详细的说明了,这篇文章就不继续介绍,直接介绍规则和例子。
正则表达式主要用于模式匹配,查看了String类的源代码,其实String类里面很多类似字符串分割和匹配的函数内部都是直接调用了Pattern类的方法。类似split方法等:
正则表达式的一些语法规则直接去看api文档就好。
正则表达式定义的例子
这个部分介绍几个正则表达式的例子,一篇文章总结了:同一个正则表达式匹配的内容可能是很不一样的,但是他们都满足了某一项规则,这个规则就是我们所说的正则表达式所表示的内容。
下面举一个例子说明:
其中:[A-Z][a-z]([A-Z][a-z])+ 具体的意思是:大写字母-小写字母(0个或多个){大写字母-小写字母(0个或多个)}(至少一次)
意思就是:至少两次:大写-(小写*)
还有一点关键点是:正则表达式在解析的时候从左往右,* 和 + 和 ?从左往右只与自己最近的一块作用。
附加常用的匹配例子
附 : 常用的正则表达式:
匹配特定数字:
^[1-9]d* //匹配正整数−[1−9]d∗ //匹配负整数
^-?[1-9]d* //匹配整数[1−9]d∗|0 //匹配非负整数(正整数 + 0)
^-[1-9]d*|0 //匹配非正整数(负整数+0)[1−9]d∗.d∗|0.d∗[1−9]d∗ //匹配正浮点数
^-([1-9]d*.d*|0.d*[1-9]d*) //匹配负浮点数−?([1−9]d