1 用途:
字符串匹配
字符串查找
字符串替换
例如:验证ip是否正确 网页中揪出email 网页中揪出链接
类:java.lang.String java.util.regex.Pattern java.util.regex.Matcher
2 String类型里面有两个方法:mathces和replaceAll。
Pattern中有compile方法
Matcher中有matchers方法
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test {
public static void main(String[] args) {
System.out.println("abc".matches("..."));//返回true
System.out.println("we3223def".replaceAll("\\d", "-"));//把数字全部替换成“-”
Pattern p = Pattern.compile("[a-z]{3}");//把正则表达式编译一下,以便提高速度
Matcher mathcer = p.matcher("dsd");//用已经编译的正则表达式去匹配字符串。产生的结果存到匹配器中
System.out.println(mathcer.matches());//把是否匹配用boolean类型打印出来。
}
}
3 认识 . * + ?
参考 :java1.5 帮助文档Pattern
public class Test2 {
public static void main(String[] args) {
//认识 . * + ?
//. 任何字符
//* 前面内容0个或多个
//+ 前面内容1个或多个
//? 前面内容0或1
System.out.println("a".matches("."));
System.out.println("aa".matches("aa"));
System.out.println("aaaa".matches("a*"));
System.out.println("aaaa".matches("a+"));
System.out.println("".matches("a*"));//true
System.out.println("".matches("a?"));//true
System.out.println("a".matches("a?"));//true
System.out.println("23425342".matches("\\d{3,100}"));
System.out.println("192.168.0.aa".matches("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}"));
System.out.println("192".matches("[1-2][0-9][0-9]"));
}
}
4 范围表述:[]
一个中括号代表匹配一个字符。
^取反 -范围 |交集 &并集
[sdv]表述取其中的某一个即可。
[^sef]表述去除了其中的内容。其他都可以
[a-z]表述从a到z
[a-zA-Z] 表述从a到z或从A到Z
[a-z]|[A-Z] 也是表述从a到z或从A到Z
[a-z[A-z]] 同上
[A-z&&[RFG]] 表述从A到Z且在[]其中的
5 认识\s \w \d \
\d 代表一位数字
\D 代表非数字
\s 代表空白字符:如空格 制表符 回车 等
\S 代表非空白字符
\w 代表名称字符:字母 数字 下划线
\W 代表非名称字符
\ 代表转译字符。
特别注意:当要判断"\"时,在java中表述变为"\\"。用正则表达式去匹配就应该为"\\",但还要用java的中去表述出来,即为"\\\\".综上所述:"\\".matches("\\\\")为true。其实要表达的意思是“\”用正则表达式“\\”来匹配。
6 POSIX (用的不多)
\p{Lower} 小写字母字符:[a-z]
\p{Upper} 大写字母字符:[A-Z]
\p{ASCII} 所有 ASCII:[\x00-\x7F]
\p{Alpha} 字母字符:[\p{Lower}\p{Upper}]
\p{Digit} 十进制数字:[0-9]
\p{Alnum} 字母数字字符:[\p{Alpha}\p{Digit}]
\p{Punct} 标点符号:!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
\p{Graph} 可见字符:[\p{Alnum}\p{Punct}]
\p{Print} 可打印字符:[\p{Graph}\x20]
\p{Blank} 空格或制表符:[ \t]
\p{Cntrl} 控制字符:[\x00-\x1F\x7F]
\p{XDigit} 十六进制数字:[0-9a-fA-F]
\p{Space} 空白字符:[ \t\n\x0B\f\r]
7 边界匹配:
^ 行的开头
$ 行的结尾
\b 单词边界
\B 非单词边界
\A 输入的开头
\G 上一个匹配的结尾
\Z 输入的结尾,仅用于最后的结束符(如果有的话)
\z 输入的结尾
public class Test3 {
public static void main(String[] args) {
System.out.println("hello sir".matches("^h.*"));//true
System.out.println("hello sir".matches(".*ir$"));//true
// \b表示单纯边界
System.out.println("hello sir".matches("^h[a-z]{1,3}o\\b.*"));//true
System.out.println("hellosir".matches("^h[a-z]{1,3}o\\b.*"));//false
System.out.println(" \n".matches("^[\\s&&[^\\n]]*\\n$"));//验证是否是“空白行”,true
}
}
8 有管Patter和Matcher的方法介绍:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test4 {
public static void main(String[] args) {
Pattern pattern = Pattern.compile("\\d{3,5}");
String s = "123-321-3214-32";
Matcher m = pattern.matcher(s);
System.out.println(m.matches());//false 记得是要全面匹配
m.reset();//把mathcer回复回去.让吃掉的内容恢复从原来的样子
//matcher的find的方法是从字符串中查找是否有符合要求的字符子串。然后把已经匹配的吃掉
System.out.println(m.find());//true
System.out.println(m.start()+"-"+m.end());//0-3
System.out.println(m.find());//true
System.out.println(m.start()+"-"+m.end());//4-7
System.out.println(m.find());//true
System.out.println(m.start()+"-"+m.end());//8-12
System.out.println(m.find());//false
//只有在能够找到子串的情况下才能使用start()和end()。否则报错
//System.out.println(m.start()+"-"+m.end());
//matcher的longingAt的方法是从字符串的开始查找是否有符合要在的字符字串。
System.out.println(m.lookingAt());//true
//字符串的替换
Pattern pa = Pattern.compile("java",Pattern.CASE_INSENSITIVE);//后面的意思是忽略大小写
String st = "java java ILoveJava YouHateJava";
Matcher mm = pa.matcher(st);
System.out.println(mm.replaceAll("JAVA"));
}
}
9 分组:在正则表达式中加入(),即可完成分组。0为整个字符串,1...为相应顺序的分组。
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class Test5 {
public static void main(String[] args) {
Pattern pa = Pattern.compile("(\\d{3,5})([a-z]{2})");
Matcher m = pa.matcher("123dw-31243bf-3243");
System.out.println(m.matches());//false
m.reset();
while(m.find()){
System.out.println("-----");
System.out.println(m.group());//默认为0 即全组
System.out.println(m.group(1));
System.out.println(m.group(2));
}
}
}