正则表达式

正则表达式简介

正则表达式对复杂的文本处理具有灵活简洁的优势,正则不仅仅在Java中有,大部分的编程语言、数据库、文本编辑器、开发环境都支持正则表达式,但是在不同环境下可能会有略微不同。在前端正则表达式经常用作校验用户输入的数据是否符合要求。

正则表达式就是描述了一个规则,通过这个规则可以匹配一类字符串。学习正则表达式很大程度上就是学习它的语法规则

开发中使用正则表达式的流程

  1. 分析要匹配的数据,写出对应的正则表达式
  2. 在工具软件中进行匹配测试,设置一些典型数据或者边界值或者是自己不确定是否能匹配到的值;也可以另外写段代码进行测试。
  3. 在程序中调用通过测试的正则表达式。

正则表达式语法(1)

  • 普通字符

    字母、数字、汉字、下划线以及没有特殊定义的标点符号都是**“普通字符”**。表达式中的普通字符在匹配一个字符串时,匹配与之相同的一个字符串(比如表达式a2你_!意为匹配a2你_!这个字符串)。

  • 简单的转义字符
    在这里插入图片描述

正则表达式语法(2)

  • 标准字符集合

    ——能够与‘多种字符’匹配的表达式

    ——注意区分大小写,大写与小写意思相反,比如\D表示除0~9以外的任何字符

    \d任意一个0~9的数字
    \w任意一个字母或数字或下划线,即AZ,az,0~9中的任意一个
    \s空格、制表符、换行符等空白字符中的任意一个
    .小数点匹配除**“\n”外的所有字符,匹配所有字符一般用[\s\S]**

    [\s\S] 中间相当于有一个或,就是取\s或者\S,\s 取空格、制表符、换行符等空白字符中的任意一个,\S取所有字符去掉\s,所以就取到了所有字符。

正则表达式语法(3)

  • 自定义字符集合

    ——[]中括号匹配方式,能够匹配中括号内部的任意一个字符

    [ab5@]匹配“a”或者“b”或者“5”或者“@”
    [^abc]匹配“a”,“b”,"c"之外的任意一个字符
    [f-k]匹配"f"到"k"之间的任意一个字符(包括f和k)
    [^F-K2-5]匹配“F”-“K”,“2”-"5"之外的任意一个字符

    ——正则表达式的特殊符号被包括在中括号中则失去特殊意义(比如 在 中 括 号 中 只 表 示 普 通 字 符 " 在中括号中只表示普通字符" ""),除了 ^,-之外。

    ——标准字符集合,除小数点外,如果被包含于中括号,自定义字符集合将包含该集合。比如:

    [\d.\-+]将匹配:数字、小数点、+、-

正则表达式语法(4)

  • 量词

    ——修饰匹配字符的次数

    {n}表达式出现n次
    {m,n}表达式出现最少m次,最多n次
    {m,}表达式出现最少m次
    ?等价于{0,1},不出现或者出现一次
    +表达式至少出现一次,等价于{1,}
    *不出现或者任意次,等价于{0,}

    ——匹配次数中的贪婪模式(匹配字符越多越好,默认!)

    ​ 比如:表达式:\d{2,3} 样例:12345678 结果:匹配到123, 456, 78

    ——非贪婪模式(匹配字符越少越好,在表示匹配次数的特殊符号后再加上一个"?")

    ​ 比如:表达式:\d{2,3}? 样例:12345678 结果:匹配到12, 34, 56, 78

    注意

    ​ \d\d{3} : 表示匹配4个数字

    ​ (\d\d){3} : 表示匹配6个数字

正则表达式语法(5)

  • 字符边界

    ——(本组标记匹配的不是字符而是位置,符合某种条件的位置)

    ^与字符串开始的地方匹配
    $与字符串结束的地方匹配
    \b匹配一个单词边界

    —— \b 匹配这样一个位置:前面的字符和后面的字符不全是\w(字母,数字,下划线)

    ​ ysl\b : 能匹配123ysl,ysl,ysl$不能匹配123ysl123,yslzz,ysl_

    ​ ^y : ysl rugnjvv y匹配这个字符串开始的位置,如果是sl rugnjvv y就匹配不到

    注意:^在中括号中是取反的意思

    ​ y$ : ysl rugnjvv y匹配这个字符串开始的位置,如果是ysl rugnjvv 就匹配不到

匹配模式

  • IGNORECASE忽略大小写模式

    ——匹配时忽略大小写。

    ——默认情况下,正则表达式是区分大小写的。比如ysl只匹配ysl,不匹配YSL,开启忽略大小写模式后两者都能匹配到。

  • SINGLELINE单行模式

    ——整个文本看作一个字符串,只有一个开头和结尾。

    ——使小数点“.”可以匹配包含换行符(\n)在内的任意字符。(注意区别标准字符集合中小数点)

  • MULTILINE多行模式

    ——每行都是一个字符串,都有开头和结尾

    ——在指定了MULTILINE之后,如果需要仅匹配字符串开始和结束位置,可以使用\A和\Z。

    ​ \Ay : 匹配第一行开始位置y,如果第一行开始位置不是y就不匹配

    ​ y\Z : 匹配最后一行结束位置的y,如果最后一行结束位置不是y就不匹配

正则表达式语法(6)

  • 选择符和分组

    表达式作用
    |(分支结构)左右两边表达式之间“或”关系,匹配左边或者右边
    ()捕获组(1)在被修饰匹配次数时,括号中的表达式可以作为整体被修饰
    (2)取匹配结果的时候,括号中的表达式匹配到的内容可以被单独得到
    (3)每一对括号会分配一个编号,使用()的捕获根据左括号的顺序从1开始自动编号。捕获元素编号为0的第一个捕获是由整个正则表达式模式匹配的文本
    (?:Expression)非捕获组一些表达式中,不得不使用(),但是又不需要保存()中子表达式匹配的内容,这时可以用非捕获组来抵消使用()带来的副作用(在处理大量文本时,保存会消耗大量内存)
  • 反向引用(\nnn)

    -每一对()会分配一个编号,使用()的捕获根据左括号的顺序从1开始自动编号。

    -通过反向引用,可以对分组已捕获的字符串进行引用

    比如([a-z]{2})\1对字符串"abcd ababb dbdbdb"匹配到"abab",“dbdb”。意思是a-z任意2个字母作为捕获组,再引用一次

    (?:[a-z]{2})不影响([a-z]{2})表达的意思,只是匹配的内容不会存起来,就无法进行引用,(?:[a-z]{2})\1这个表达式将无效

正则表达式语法(7)

  • 预搜索(零宽断言)

    ——只进行子表达式的匹配,匹配内容不计入最终结果,是零宽度

    ——这个位置应该符合某个条件。判断当前位置的前后字符,是否符合指定的条件,但是不匹配前后的字符,是对位置的匹配

    ——正则表达式匹配过程中,如果子表达式匹配到的是字符内容,而非位置,并被保存到最终的匹配结果中,那么就认为这个子表达式是占有字符的;如果子表达式匹配的仅仅是位置,或者匹配的内容并不保存到最终的匹配结果中,那么就认为这个子表达式是零宽度的。占有字符还是零宽度,取决于匹配的内容是否保存到最终匹配结果中。

    (?=Expression)断言自身出现的位置的后面能匹配表达式Expression
    (?<=Expression)断言自身出现的位置的前面能匹配表达式Expression
    (?!Expression)断言自身出现的位置的后面不能匹配表达式Expression
    (?<!Expression)断言自身出现的位置的前面不能匹配表达式Expression

    [a-z]+(?=ing):对于字符串"acount going running"匹配结果为"go",“runn”

在Java中使用正则

  • 几个重要类的介绍

    Pattern 类:
    pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。

    Matcher 类:
    Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。

    PatternSyntaxException类:
    PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。

  • 代码示例

    1. Pattern类的compile方法获取表达式对象,Matcher类的matcher方法将表达式与字符串联系起来,Matcher类的matches方法去匹配整个字符串中是否符合表达式的结果。
    package regex;
    
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    /**
     * Pattern类的compile方法获取表达式对象
     * Matcher类的matcher方法将表达式与字符串联系起来
     * Matcher类的matches方法去匹配整个字符串中是否符合表达式的结果,类型为boolean
     * 比如下面“ysl2333”符合“\w+”,但是“ysl$$2333”就不符合了,返回false
     * @author shulinYuan Email:2762954662@qq.com
     *
     */
    public class Demo1 {
    	public static void main(String[] args) {
    		//判断“ysl2333”是否符合正则表达式:\w+
    		//获取表达式对象
    		Pattern p = Pattern.compile("\\w+");//注意在Java中表示\要用\\
    		//创建Matcher对象
    		Matcher m = p.matcher("ysl2333");//去匹配整个字符串中是否符合表达式的
    		boolean flag = m.matches();
    		System.out.println(flag);//true
    	}
    }
    
    

    ​ 2.详解Matcher类的find方法

    package regex;
    
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    /**
     * 详解Matcher类的find方法
     * matches方法也会指针停留,如果先调用matches方法匹配到第一个子序列
     * 再调用find方法将直接匹配第二个子序列
     * @author shulinYuan Email:2762954662@qq.com
     *
     */
    public class Demo2 {
    	public static void main(String[] args) {
    		//获取表达式对象
    		Pattern p = Pattern.compile("\\w+");//注意在Java中表示\要用\\
    		//创建Matcher对象
    		Matcher m = p.matcher("ysl2333@@456@@nfj");
    		//给出序列是否有子序列符合表达式,调用一次,如果找到一个,那么指针会停留在这,
    		//下次再调用将匹配下一个子序列
    		boolean flag = m.find();
    		System.out.println(flag);//true
    		flag = m.find();
    		System.out.println(flag);//true
    		flag = m.find();
    		System.out.println(flag);//true
    		flag = m.find();
    		System.out.println(flag);//false
    	}
    }
    
    

    ​ 3.Matcher类的group方法要与find方法联合使用

    package regex;
    
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    /**
     * Matcher类的group方法要与find方法联合使用,将find方法找到的子序列提取出来
     * @author shulinYuan Email:2762954662@qq.com
     *
     */
    public class Demo3 {
    	public static void main(String[] args) {
    		//获取表达式对象
    		Pattern p = Pattern.compile("\\w+");//注意在Java中表示\要用\\
    		//创建Matcher对象
    		
    		Matcher m = p.matcher("ysl2333@@456@@nfj");
    		/*用法一
    		m.find();
    		String str = m.group(0);
    		System.out.println(str);//ysl2333
    		m.find();
    		str = m.group();//等价于group(0)
    		System.out.println(str);//456
    		*/
    		while(m.find()) {
    			System.out.println(m.group());//三个子序列都将被打印:ysl2333,456,nfj
    			System.out.println(m.group(0));
    		}
    	}
    }
    
    

    ​ 4.测试group方法与捕获组

    package regex;
    
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    /**
     * 测试group方法与捕获组
     * @author shulinYuan Email:2762954662@qq.com
     *
     */
    public class Demo4 {
    	public static void main(String[] args) {
    		//获取表达式对象
    		Pattern p = Pattern.compile("([a-z]+)([0-9]+)");//注意在Java中表示\要用\\
    		//创建Matcher对象
    		Matcher m = p.matcher("aac223**bbd89**kk99");
    		
    		while(m.find()) {
    			System.out.println(m.group());//aac223,bbd89,kk99
    			System.out.println(m.group(1));//aac,bbd,kk
    			System.out.println(m.group(2));//223,89,99
    		}
    	}
    }
    
    

    ​ 5.替换

    package regex;
    
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    /**
     * 替换
     * @author shulinYuan Email:2762954662@qq.com
     *
     */
    public class Demo5 {
    	public static void main(String[] args) {
    		//获取表达式对象
    		Pattern p = Pattern.compile("\\d");//注意在Java中表示\要用\\
    		//创建Matcher对象
    		Matcher m = p.matcher("aac223**bbd89**kk99");
    		//将数字替换成'$'
    		String newStr = m.replaceAll("\\$");
    		System.out.println(newStr);//aac$$$**bbd$$**kk$$
    	}
    }
    
    

    ​ 6.分割

    package regex;
    
    /**
     * 分割
     * @author shulinYuan Email:2762954662@qq.com
     *
     */
    public class Demo6 {
    	public static void main(String[] args) {
    		String str1 = "a,b,c,d";
    		//以逗号切割
    		String[] newStr1 = str1.split(",");
    		for (String string : newStr1) {
    			System.out.println(string);
    		}
    		String str2 = "abc334gnk667nbjd89";
    		//以数字切割
    		String[] newStr2 = str2.split("\\d+");
    		for (String string : newStr2) {
    			System.out.println(string);
    		}
    	}
    }
    
    

如有建议欢迎指教,可以到我的博客上与我交流,这里的评论更难及时接收。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值