正则表达式

正则表达式是用于匹配字符串中字符组合的模式

正则表达式是处理文本的利器

例如:

小试牛刀

public static void main(String[] args) {
		String str = "再见,JAVA,你好,Golang,学好编程,program";
		//  创建一个模式对象,可以理解为一个正则表达式对象
		Pattern pattern = Pattern.compile("[a-zA-Z]+");
		//  匹配器,按照pattern模式,到str文本中去匹配,找到返回true,否则为false
		Matcher matcher = pattern.matcher(str);
		while (matcher.find()){
			System.out.println(matcher.group(0));
		}
	}

正则表达式底层原理

matcher.find()  原理

1. 根据指定的规则,定位满足规则的子字符串(比如1998)

2. 找到后,将子字符串的开始索引记录到matcher对象的属性  int[] groups中,并将 groups[0] = 0  ;把该子字符串的结束的索引+1 的值记录到  groups[1] = 4

3. 同时记录oldLast的值为  子字符串的结束的 索引+1的的值,即下次执行find是,就从4开始匹配

================================================

分组

比如 (\d\d)(\d\d),正则表达式中有()表示分组,第一个()表示第一组,第二个()表示第二组

1. 根据指定的规则,定位满足规则的子字符串(比如(19)98)

2. 找到后 ,将 子字符串的开始的索引记录到matcher 对象的属性   int  groups;

        2.1  groups[0] = 0,把该子字符串的结束索引+1的值记录到groups[1] = 4

        2.2 记录1组() 匹配到的字符串 groups[2]  = 0  groups[3] = 2

        2.3 记录2组()匹配到的字符串groups[4] =2    groups[] = 4

        2.4  如果有更多的分组,以此类推

小结

1. 如果正则表达式有(),即分组

2. 取出匹配的字符串规则如下

3.    group(0)   表示匹配到的子字符串

4.    group(1)   表示匹配到的子字符串的第一组字符串

4.    group(2)   表示匹配到的子字符串的第二组字符串

元字符功能

 元字符-----> 转义号

元字符---->  元素匹配符

 

不区分大小写:

1. 法一

2.法二

元字符----->  选择匹配符

元字符----->正则限定符

 元字符---->正则定位符

分组

例题:

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值