Pattern正则表达式

Pattern (Java 2 Platform SE 6)

java.util.regex  
类 Pattern

java.lang.Object

  java.util.regex.Pattern

所有已实现的接口:
Serializable

public final class Pattern
extends Object implements Serializable

正则表达式的编译表示形式。

指定为字符串的正则表达式必须首先被编译为此类的实例。然后,可将得到的模式用于创建  Matcher   对象,依照正则表达式,该对象可以与任意字符序列 匹配。执行匹配所涉及的所有状态都驻留在匹配器中,所以多个匹配器可以共享同一模式。

因此,典型的调用顺序是

 Pattern p = Pattern.compile

("a*b");
 Matcher m = p.matcher

("aaaaab");
 boolean b = m.matches

();

在仅使用一次正则表达式时,可以方便地通过此类定义  matches   方法。此方法编译表达式并在单个调用中将输入序列与其匹配。语句

 boolean b = Pattern.matches("a*b", "aaaaab");
等效于上面的三个语句,尽管对于重复的匹配而言它效率不高,因为它不允许重用已编译的模式。

此类的实例是不可变的,可供多个并发线程安全使用。Matcher   类的实例用于此目的则不安全。

正则表达式的构造摘要
非捕获组
构造匹配
 
字符
x 字符  x
\\ 反斜线字符
\0 n 带有八进制值  0   的字符  n   (0 <=  n  <=  7)
\0 nn 带有八进制值  0   的字符  nn   (0 <=  n  <=  7)
\0 mnn 带有八进制值  0   的字符  mnn (0 <=  m  <=  3、0 <=  n  <=  7)
\x hh 带有十六进制值 0x   的字符  hh
\u hhhh 带有十六进制值 0x   的字符  hhhh
\t 制表符 ('\u0009' )
\n 新行(换行)符 ('\u000A' )
\r 回车符 ('\u000D' )
\f 换页符 ('\u000C' )
\a 报警 (bell) 符 ('\u0007' )
\e 转义符 ('\u001B' )
\c x 对应于  x   的控制符
 
字符类
[abc] ab    c (简单类)
[^abc] 任何字符,除了  ab    c (否定)
[a-zA-Z] a    z    A    Z ,两头的字母包括在内(范围)
[a-d[m-p]] a    d    m    p[a-dm-p] (并集)
[a-z&&[def]] de    f (交集)
[a-z&&[^bc]] a    z ,除了  b    c[ad-z] (减去)
[a-z&&[^m-p]] a    z ,而非  m    p[a-lq-z] (减去)
 
预定义字符类
. 任何字符(与行结束符 可能匹配也可能不匹配)
\d 数字:[0-9]
\D 非数字:  [^0-9]
\s 空白字符:[ \t\n\x0B\f\r]
\S 非空白字符:[^\s]
\w 单词字符:[a-zA-Z_0-9]
\W 非单词字符:[^\w]
 
POSIX 字符类(仅 US-ASCII)
\p{Lower} 小写字母字符:[a-z]
\p{Upper} 大写字母字符:[A-Z]
\p{ASCII} 所有 ASCII:[\x00-\x7F]
\p{Alpha} 字母字符:[\p{Lower}\p{Upper}]
\p{Digit} 十进制数字:[0-9]
\p{Alnum} 字母数字字符:[\p{Alpha}\p{Digit}]
\p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
\p{Graph} 可见字符:[\p{Alnum}\p{Punct}]
\p{Print} 可打印字符:[\p{Graph}\x20]
\p{Blank} 空格或制表符:[ \t]
\p{Cntrl} 控制字符:[\x00-\x1F\x7F]
\p{XDigit} 十六进制数字:[0-9a-fA-F]
\p{Space} 空白字符:[ \t\n\x0B\f\r]
 
java.lang.Character 类(简单的  java 字符类型
\p{javaLowerCase} 等效于 java.lang.Character.isLowerCase()
\p{javaUpperCase} 等效于 java.lang.Character.isUpperCase()
\p{javaWhitespace} 等效于 java.lang.Character.isWhitespace()
\p{javaMirrored} 等效于 java.lang.Character.isMirrored()
 
Unicode 块和类别的类
\p{InGreek} Greek 块(简单 )中的字符
\p{Lu} 大写字母(简单类别
\p{Sc} 货币符号
\P{InGreek} 所有字符,Greek 块中的除外(否定)
[\p{L}&&[^\p{Lu}]]  所有字母,大写字母除外(减去)
 
边界匹配器
^ 行的开头
$ 行的结尾
\b 单词边界
\B 非单词边界
\A 输入的开头
\G 上一个匹配的结尾
\Z 输入的结尾,仅用于最后的结束符 (如果有的话)
\z 输入的结尾
 
Greedy 数量词
X ? X ,一次或一次也没有
X * X ,零次或多次
X + X ,一次或多次
X { n } X ,恰好  n  
X { n ,} X ,至少  n  
X { n , m } X ,至少  n   次,但是不超过  m  
 
Reluctant 数量词
X ?? X ,一次或一次也没有
X *? X ,零次或多次
X +? X ,一次或多次
X { n }? X ,恰好  n  
X { n ,}? X ,至少  n  
X { n , m }? X ,至少  n   次,但是不超过  m  
 
Possessive 数量词
X ?+ X ,一次或一次也没有
X *+ X ,零次或多次
X ++ X ,一次或多次
X { n }+ X ,恰好  n  
X { n ,}+ X ,至少  n  
X { n , m }+ X ,至少  n   次,但是不超过  m  
 
Logical 运算符
XY X   后跟  Y
X | Y X    Y
( X ) X,作为捕获组
 
Back 引用
\ n 任何匹配的  n th  捕获组
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值