正则表达式源码解释(java)

正则表达式初学

正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式(规则)的文本。

说简单点,就是我们可以利用正则表达式来处理文本,比如查找文本中love这个单词出现了几次,把文本中的‘爱’全部替换成love
都可以用正则表达式来快速完成。

结合代码具体讲

以要查找文本中的四位数字为列

1、编辑一个正则表达式,得到一个模式对象
2、模式对象与你的文本相匹配,得到一个匹配器(里面装有匹配到的内容)
3、匹配器调用find方法看是否找到,找到就再调用group方法输出找到的内容

public class RegEx01 {
    public static void main(String[] args) {

        String content="1324 hello my love 3456 will still forever";

        //1.正则表达式,\\d表示0~9的任意一个数字
        String regex="\\d\\d\\d\\d";//表示一个四位数字,学习正则表达式语法就懂
        //2.创建模式(pattern)对象,编译编辑(compile)一个正则表达式(pattern)
        Pattern pattern = Pattern.compile(regex);
        //3.模式匹配文本(得到一个匹配器)
        Matcher matcher = pattern.matcher(content);

        while(matcher.find()){
            //System.out.println("找到了: "+matcher.group());
            System.out.println("找到了: "+matcher.group(0));
        }

    }
}

debug详讲

在这里插入图片描述
此时我们可以看到确实创建了一个模式pattern,里面放的是正则表达式;也创建了一个匹配器,注意此时匹配器里group数组没有放有效数据

在这里插入图片描述
进入到matcher的find方法里面,find返回一个布尔值,即找到所需内容返回true,否则返回false

在这里插入图片描述
执行完find方法后,已经找到了数据并把数据记录在了匹配器matcher的group数组里(注意这里记录的是数据的索引下标)(可通过下面的test和索引下标得到数据)

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
我们发现group方法底层为substring方法,通过下标索引来返回原字符串。
比如这里的0~4索引下标是返回下标为 0~3的字符串(即四位数),看jdk文档

在这里插入图片描述
在这里插入图片描述
追溯源码后一切就明了了

1、 先创建了一个模式对象pattern(即正则表达式)和一个匹配器matcher
2、matcher调用find方法判断有没有找到所需数据,若找到就,把数据索引下标存到matcher的groups数组
3、matcher调用group方法找到group区间(groups[group * 2], groups[group * 2 + 1]),即groups[0]和groups[1],找到里面存的数据下标0和4,底层调用substring方法还原出所需字符串

更多源码追溯看下回~~~

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
前言:本资来自于javaeye,原资链接地址:http://www.javaeye.com/topic/67398 原文如下: 以前写了一个java的正规表达式的java工具类,分享一下,有用到的欢迎下载使用。 如果你有常用的定义好的,且测试通过的正规表达式,欢迎跟贴,也让我享用一下 . 类中用到了 jakarta-oro-2.0.jar 包,请大家自己在 apache网站下下载 在这是junit测试单元类我就不提交了,在main()方法中有几个小测试,有兴趣自己玩吧. 这个工具类目前主要有25种正规表达式(有些不常用,但那时才仔细深入的研究了一下正规,写上瘾了,就当时能想到的都写了): 1.匹配图象; 2 匹配email地址; 3 匹配匹配并提取url ; 4 匹配并提取http ; 5.匹配日期 6 匹配电话; 7 匹配身份证 8 匹配邮编代码 9. 不包括特殊字符的匹配 (字符串中不包括符号 数学次方号^ 单引号' 双引号" 分号; 逗号, 帽号: 数学减号- 右尖括号> 左尖括号 0) 12 匹配正整数 13 匹配非正整数(负整数 + 0) 14 匹配负整数; 15. 匹配整数 ; 16 匹配非负浮点数(正浮点数 + 0) 17. 匹配正浮点数 18 匹配非正浮点数(负浮点数 + 0) 19 匹配负浮点数; 20 .匹配浮点数; 21. 匹配由26个英文字母组成的字符串; 22. 匹配由26个英文字母的大写组成的字符串 23 匹配由26个英文字母的小写组成的字符串 24 匹配由数字和26个英文字母组成的字符串; 25 匹配由数字、26个英文字母或者下划线组成的字符串; java码: /* * Created on 2005-4-15 * * Summary of regular-expression constructs 正则表达式结构简介: * Construct Matches * Characters 字符: * x The character x x 字符 x * \\ The backslash character \\ 反斜杠 * \0n The character with octal value 0n (0 <= n <= 7) \0n 十进制数 (0 <= n <= 7) * \0nn The character with octal value 0nn (0 <= n <= 7) \0nn 十进制数 0nn (0 <= n <= 7) * \0mnn The character with octal value 0mnn (0 <= m <= 3, 0 <= n <= 7) \0mnn 十进制数 0mnn (0 <= m <= 3, 0 <= n <= 7) * \xhh The character with hexadecimal value 0xhh \xhh 十六进制数 0x

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值