正则表达式笔记
⼀、概念
正则表达式,⼜称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的⼀个概念。正则表达式通常被⽤来检索、替换那些符合某个模式(规则)的⽂本。在众多 语⾔中都可以⽀持 正则表达式,如Perl、PHP、Java、Python、Ruby等。当然在Java中也可以通过处理字符串的⽅式达到检索,替换⽂本字符串的⽬的,但是有了正则表达式写代码更加简洁,通常两三⾏代码就可以达到⽬的,当然这也是建⽴在熟悉正则表达式的基础之上的。
⼆、正则表达式的规则
- 任意⼀个字符表示匹配任意对应的字符,如a匹配a,7匹配7,-匹配-。
- []代表匹配中括号中其中任⼀个字符,如[abc]匹配a或b或c。
- \在中括号⾥⾯和外⾯代表含义不同,如在外时,就匹配-,如果在中括号内[a-z]表示匹配26个⼩写字⺟中的任⼀个;[a-zA-Z]匹配⼤⼩写共52个字母中任⼀个;[0-9]匹配⼗个数字中任⼀个。
- ^在中括号⾥⾯和外⾯含义不同,如在外时,就表示开头,如^7[0-9]表示匹配开头是7的,且第⼆位是任⼀数字的字符串;如果在中括号⾥⾯,表示除了这个字符之外的任意字符(包括数字,特殊字符),如[^abc]表示匹配出去
abc之外的其他任⼀字符。 - .表示匹配任意的字符。
- \d表示数字。
- \D表示⾮数字。
- \s表示由空字符组成,[ \t\n\r\x\f]。
- \S表示由⾮空字符组成,[^\s]。
- \w表示字⺟、数字、下划线,[a-zA-Z0-9_]。
- \W表示不是由字⺟、数字、下划线组成。
- ?: 表示出现0次或1次。
- +表示出现1次或多次。
- *表示出现0次、1次或多次。
- {n}表示出现n次。
- {n,m}表示出现n~m次。
- {n,}表示出现n次或n次以上。
- XY表示X后⾯跟着Y,这⾥X和Y分别是正则表达式的⼀部分。
- X|Y表示X或Y,⽐如"food|f"匹配的是foo(d或f),⽽"(food)|f"匹配的是food或f。
- (X)⼦表达式,将X看做是⼀个整体。
三、Java中如何写正则表达式
在java中调⽤正则表达式的类是java.util.regex.Matcher和java.util.regex.Pattern,java.util.regex包是从jdk1.4开
始提供的。有多种写法来使⽤正则表达式。
- 仅仅是匹配
-
实现⽅式1,匹配⼀个数字。
public void regex1() { //要匹配的字符 String str = "8"; //正则表达式 String regex = "[0-9]"; //返回匹配的结果,匹配成功就返回true,失败就返回false,此次匹配返回true。 boolean flag = Pattern.matches(regex, str); System.out.println(flag); }
-
实现⽅式2, 匹配3个到5个字⺟,⼤⼩写不限,包括3和5个。
public void regex2() { //要匹配的字符 String str = "hello"; //正则表达式 String regex = "[a-zA-Z]{3,5}"; //输出匹配的结果, 此次匹配返回true。 System.out.println(str.matches(regex)); }
-
实现⽅式3(此种实现⽅式最快), 匹配11位的电话号码,匹配规则:第⼀个数字是1,第⼆个数字是2,3,7,8中任
⼀个,后⾯9位数字中不包含4。public void regex3() { //要匹配的字符 String str = "13656231253"; //正则表达式 String regex = "1[2378][0-35-9]{9}"; //将给定的正则表达式编译为模式。 如果匹配需求较多,且需⽤同相同的regex去匹配,就可将这句写到静态 模块⾥⾯,⽤的时候直接使⽤实例p Pattern p = Pattern.compile(regex); //创建⼀个匹配器,匹配给定的输⼊与此模式。 Matcher m = p.matcher(str); //尝试将整个区域与模式进⾏匹配。 boolean flag = m.matches(); //输出匹配结果,此次结果为true System.out.println(flag); }
-
替换。
public void regexReplace () { //要匹配的字符 String str = "12a6B985Ccv65"; //正则表达式 String regex = "[a-zA-Z]+"; //正则表达式 String regex2 = "\d+"; //将字符串中英⽂字⺟替换为&符号,输出12&6&985&65 System.out.println(str.replaceAll(regex, "&")); //将字符串中单个数字或者连续的数字替换为0,输出0a0B0Ccv0 System.out.println(str.replaceAll(regex2,"0")); }
-
切割,根据⼤写字⺟切割字符串。
public void outputStr() { String str = "oneTtowTthreeDfourJfive"; String regex = "[A-Z]"; String[] arr = str.split(regex); for (String s: arr) { //将给定的正则表达式编译为模式。 如果匹配需求较多,且需⽤同相同的regex去匹配,就可将这句写到静态 模块⾥⾯,⽤的时候直接使⽤实例p Pattern p = Pattern.compile(regex); //创建⼀个匹配器,匹配给定的输⼊与此模式。 Matcher m = p.matcher(str); //尝试将整个区域与模式进⾏匹配。 boolean flag = m.matches(); //输出匹配结果,此次结果为true System.out.println(flag); } System.out.print(s + " "); } }
输出:one tow three four five