java数据结构与算法基础-----字符串------正则表达式的练习案例---持续补充中

java数据结构与算法刷题目录(剑指Offer、LeetCode、ACM)-----主目录-----持续更新(进不去说明我没写完):https://blog.csdn.net/grd_java/article/details/123063846
正则表达式基础:https://blog.csdn.net/grd_java/article/details/136120841

一、简单的应用实例

1. 验证输入的是否是汉字

  1. 百度,或者问人工智能ChatGPT等,查询unicode对应的汉字编码,我们查到是16进制的4e00 - 9fa5. 对应到正则表达式就是\u4e00-\u9fa5
    在这里插入图片描述
  2. 我们对一个字符串进行匹配,必须满足汉字开头,汉字结尾,也就是全部都得是汉字,所以需要用到正则定位符^$来定位开头和结尾。匹配所有汉字1个或多个,使用[\u4e00-\u9fa5]+
    在这里插入图片描述
  3. 此时如果我们匹配的字符串并不全由汉字组成,就会返回false
    在这里插入图片描述

2. 数字相关

6位数,第一个数不能为0,其余5个数随便。例如123890

在这里插入图片描述

public static void main(String[] args) {
        String content = "125806";
        Pattern pattern = Pattern.compile("^[1-9]\\d{5}$");
        Matcher matcher = pattern.matcher(content);//按照pattern定义的匹配规则,到content中匹配
        if(matcher.find()) System.out.println("匹配成功");
        else System.out.println("匹配失败");
    }
qq号码:1-9开头,剩余数字随便的5-10位数,例如12389,914401258

在这里插入图片描述

  1. 关键在于使用{num1,num2}来限定数量,因为一共5-10个数,开头确定不能为0,剩余4-9个就可以用\\d{4,9}来作为匹配规则
手机号码:以13、14、15、18开头的11位数,例如13722095854

在这里插入图片描述

3. 验证复杂的URL

下面的案例并不严谨,只是练习,如果想要正在利用正则表达式解决相关问题,做字符串相关的算法题会达到专项提升的效果。类似于数据库中sql语句的运用,就是不断解决问题,提高自己的处理问题的能力。

随便找一个URL为例:https://www.bilibili.com/video/BV1j4411W7F7/?spm_id_from=333.337.search-card.all.click&vd_source=f0637064fb8570e4bb79c51a3c016b30
在这里插入图片描述

  1. 第一部分:https://或者http://。正则表达式非常简单:(?<one>http(?:s|))://,首先是命名捕获分组,名称为one,限定匹配https或者http。后面跟://
  2. 第二部分:域名,前面的部分可能由若干个:数字、字母、下划线、横线+一个点组成。最后会跟.cn或.com等等。(?<two>(?:[\\w-]+\\.)+[\\w-]+)命名捕获为two,\\w表示任意字母数字或下划线,[\\w-]表示从\\w或者-选一个。后面跟+,表示匹配若干个,然后\\.表示匹配点。然后将这部分整体用+修饰,表示匹配若干个。最后通过[\\w-]+匹配最后的.cn等内容
    在这里插入图片描述
  3. 第3部分:后面的路径和文件名。主要由/分隔,并且由数字、字母、下划线、-、?、=、&、/、%、.、组成。当然第3部分是可有可无的,例如www.baidu.com就没有第三部分。所以用?修饰,表示0个或1个第三部分。正则表达式为(?<three>(?:\/[\w-?=&/%.]*))?$
    在这里插入图片描述

各位可能有些许疑问,[.]中的点,为什么不加转义符号,因为点是特殊字符,如果我们想要原样匹配,需要加转义符号[\\.]的形式。这是因为,类似(?:pattern)和[pattern]这种,都可以不需要转义符,而直接原样匹配特殊字符

    public static void main(String[] args) {
        String content = "https://www.bilibili.com/video/BV1j4411W7F7/?spm_id_from=333.337.search-card.all.click&vd_source=f0637064fb8570e4bb79c51a3c016b30";
        Pattern pattern = Pattern.compile(
                "(?<one>http(?:s|))://"+
                        "(?<two>(?:[\\w-]+\\.)+[\\w-]+)"+
                        "(?<three>(?:\\/[\\w-?=&/%.]*))?$"
        );
        Matcher matcher = pattern.matcher(content);//按照pattern定义的匹配规则,到content中匹配
        while(matcher.find()){
            System.out.println("匹配到的URL:"+matcher.group(0));
            System.out.println("http协议为:"+matcher.group("one"));
            System.out.println("主机资源地址(ip+端口号或者域名):"+matcher.group("two"));
            System.out.println("路径和文件位置:"+matcher.group("three"));
        }
    }

二、反向引用案例

三、结巴去重案例

四、算法题

  • 19
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

殷丿grd_志鹏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值