正则表达式是一种可以用于模式匹配和替换的规范,一个正则表达式就是由普通的字符(例如字符a到z)以及特殊字符(元字符)组成的文字模式,它用以描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
常用的语法:
逻辑表达式
XY: 表示X后面跟着Y,这里X和Y分别是正则表达式的一部分
X|Y:表示X或Y,比如"food|f"匹配的是foo(d或f),而"(food)|f"匹配的是food或f
(X):子表达式,将X看做是一个整体
字符的取值范围
[abc] : 表示可能是a,可能是b,也可能是c。
简洁的字符表示
.:匹配任意的字符
\d:表示数字
\D:表示非数字
\s:表示由空字符组成,[ \t\n\r\x\f]
\S:表示由非空字符组成,[^\s]
\w:表示字母、数字、下划线,[a-zA-Z0-9_]
\W:表示不是由字母、数字、下划线组成
数量表达式
?: 表示出现0次或1次
+: 表示出现1次或多次
*: 表示出现0次、1次或多次
{n}:表示出现n次
{n,m}:表示出现n~m次
{n,}:表示出现n次或n次以上
java中提供了两个类来支持正则表达式的操作
分别是java.util.regex下的Pattern类和Matcher类
使用Pattern类进行字符串的拆分,使用的方法是String[] split(CharSequence input)
使用Matcher类进行字符串的验证和替换,
匹配使用的方法是boolean matches()
替换使用的方法是 String replaceAll(String replacement)
Pattern类的构造方法是私有的
所以我们使用Pattern p = Pattern.compile(“a*b”);进行实例化
Matcher类的实例化依赖Pattern类的对象Matcher m = p.matcher(“aaaaab”);
在实际的开发中,为了方便我们很少直接使用Pattern类或Matcher类,而是使用String类下的方法
验证:boolean matches(String regex)
拆分: String[] split(String regex)
替换: String replaceAll(String regex, String replacement)
在Java的字符串中""有两个功能
(一)代表特殊字符:\t代表制表符,\n代表换行…等。
(二)代表转义,在字符串中,如果出现” ‘ \,会造成代码歧义
造成歧义的有 \ ’ "当我们想让他们代表普通字符的时候就需要变成\ ’ "
在正则中”\”同样被赋予了两个功能
(一)代表特殊功能的字符:如\d代表数组
(二)代表转义,和上面一样,当出现字符歧义时,加上\表示普通字符。
JAVA中匹配反斜杠的正则表达式的书写方式为:
String regex="\\";