一看就懂:正则表达式不用背

0bd25ec8fe0459026d571769b33caf00.jpeg来源:blog.csdn.net/sunnyzyq/article/details/122840555

👉 欢迎加入小哈的星球 ,你将获得: 专属的项目实战/ Java 学习路线 / 一对一提问 / 学习打卡

目前, 正在星球内部带小伙伴做第一个项目:前后端分离博客,手摸手,后端 + 前端全栈开发,从 0 到 1 讲解每个功能点开发步骤,1v1 答疑,直到项目上线。目前已更新了94小节,累计13w+字,讲解图:630张,还在持续爆肝中.. 后续还会上新更多项目,如秒杀系统, 在线商城, IM即时通讯等,戳我加入学习,已有290+小伙伴加入(一顿饭钱)

  • 案例引入

  • 正则表达式

    • 正则:普通字符

    • 正则:\d

    • 正则:\D

    • 正则:\w

    • 正则:\W

    • 正则:\s

    • 正则:\S

    • 正则:.

    • 正则:|

    • 正则:[abc]

    • 正则:[^abc]

    • 正则:[a-z]

    • 正则:[^a-z]

    • 正则:\num

    • 正则:?

    • 正则:+

    • 正则:{n}

    • 正则:{n,m}

    • 正则:*

    • 命名规范

    • 结构组成

    • 用途场景

    • Java中的正则校验

    • 正则元字符

Part1案例引入

在讲正则表达式前,我们不妨先从一个场景来逐渐引入。

你可能有过这样的经历:我们去某些网站注册帐号,当你在设置密码的时候,网站会提示你密码的长度范围,以及对应的规则限制(如下图)。

09abd4201c11181225f6d3a6016692dd.png
图片

根据上图,我们将密码设置规则可以描述为两个条件:

  • 长度为6-16位;

  • 密码中必须包含数字,大写字母,小写字母,特殊字符(指定字符);

现在假设我们不知道正则表达式,作为程序员的你,该如何去实现这样一个密码验证呢?

下面是我写的一个校验方法(样本):

/**
 * 校验用户密码是否满足设置规则
 * 
 * @param password 用户输入的密码
 * @return true-满足;false-不满足
 */
public static boolean checkPassword(String password) {
    // 密码不能为空
    if (password == null || password.isEmpty()) {
        return false;
    }
    // 校验密码长度(6-16位)
    int len = password.length();
    if (len < 6 || len > 16) {
        return false;
    }
    // 定义四种组合条件
    boolean hasNumber = false;
    boolean hasSmallLetter = false;
    boolean hasBigLetter = false;
    boolean hasSpecialChar = false;
    // 将密码字符串拆分为单个字符,然后对每个字符进行校验
    char[] chars = password.toCharArray();
    for (char c : chars) {
        // 是否包含数字0-9
        if (c >= '0' && c <= '9') {
            hasNumber = true;
            continue;
        }
        // 是否包含小写字母a-z
        if (c >= 'a' && c <= 'z') {
            hasSmallLetter = true;
            continue;
        }
        // 是否包含大写字母A-Z
        if (c >= 'A' && c <= 'Z') {
            hasBigLetter = true;
            continue;
        }
        // 是否满足指定的特殊字符
        if ("~@#S%*_-+=:.?".indexOf(c) > 0) {
            hasSpecialChar = true;
            continue;
        }
        // 如果某个字符不在上面四种情况,则不满足规则
        return false;
    }
    // 如果四种组合条件均满足,则符合密码设置规则
    return hasNumber && hasSmallLetter && hasBigLetter && hasSpecialChar;
}

这个方法写得对不对呢?我们不防用几组密码去进行验证下:

d3996b4eb74ff3f81ffaffacbff3c218.png
图片

可以看到,我们列举的8组密码,都得到了验证,说明我们的方法是OK的。

但这样一个密码设置规则校验,我们就差不多写近 30 行的代码,是不是感觉有点累赘了呢?明明规则很简单,代码量却写了这么多,有没有什么方法可以简化我们的代码呢?当然有!于是,这时就可以让我们今天的主角正则表达式出场了。

下面,则是具有相同校验功能,基于正则表达式的验证方法:

/**
 * 通过正则表达式校验用户密码是否满足设置规则
 * 
 * @param password 用户输入的密码
 * @return true-满足;false-不满足
 */
public static boolean checkPasswordByRegex(String password) {
    return Pattern.matches("^(?=.*[0-9])(?=.*[a-z])(?=.*[A-Z])(?=.*[~@#S%*_\\-+=:.?])[A-Za-z0-9~@#S%*_\\-+=:.?]{8,20}$", password);
}

那么它写得到底对不对呢?于是,我们可以通过上面的示例数据,继续调用该方法来进行验证:

5bb3af308809adcdb41b1533061a87c8.png
图片

通过结果我们可以看到,他也是符合我们预期的。于是我们发现,在不用正则表达式的时候,我们的代码量近30行,而使用了正则表达式,代码就浓缩为了1行,也就是说,使用正则表达式时可以简化我们的代码。

但同时我们也可知,正则表达式具有一定的学习成本,如果你不懂正则表达式,那么你看它可能就是一头雾水,如果出了问题,更也就无从下手去修改它了。

所以,学会正则表达式还是有必要的,至少以后你的同事写出来后,不会在脑子里出现 "这是写的啥玩意儿啊?怎么我看不懂" 的想法。

Part2正则表达式

什么是正则表达式?通过上面的案例大家可能多少有点了解了。是的,他就是通过一行字符串,来描述一定的规则(如下图箭头所指红框处)。

1命名规范

571f07c891a120a2abe500853216e129.png
图片

正则表达式的英文为 Regular Expression,所以我们通常采用这两个单词的首几个字母合在一起,把正则表达式相关的变量名定义为 regexp(单数) 或 regexps(复数) 。

比如:

78650f3fd53cfa18a7c4180082b17f97.png
图片

又比如,在 Java 的 String 类中,有几个相关替换的方法,它也是支持正则表达式的,他的参数命名也是 regex 。

64a5083839483cbb1900ab602af49e8c.png
图片

2结构组成

正则表达式通常由一些普通字符,以及一些元字符组成。

普通字符:就是本身作为一个字符时,它不具有其他含义,像我们常用的大小写字母和数字。

元字符:就是除了本身作为一个字符外,他还可以表达其他含义(下图是部分元字符节选)。

85653691c990c013240a509a8e546a6a.png
图片

其实,我们学习正则表达式,大部分就是基于元字符的学习。

3用途场景

学习了正则表达式,我们可以有哪些用途场景呢?

1)做字符串的规则验证(比如前面的案例引入中,我们可以通过正则表达式来验证一个密码是否符合规则)。

2)做字符串的替换(比如将一个字符串中所有的大小写字母去掉,或者替换为指定符号)。

3)提取字符串中所需要的字符(比如一个字符串中所有的数字提取出来,组成一个新的字符串)。

4Java中的正则校验

正则表达式主要用途就是校验字符串,那么在Java中,只需要通过下面这个方法即可进行校验。

boolean result = Pattern.matches(regex, input);

其中:

  • regex 是我们需要写的正则表达式校验规则;

  • input 是我们待校验的字符串;

返回的 result 就是我们校验的结果,当为 true 的时候,表示校验通过,当为 false 的时候,则表示校验不通过。

5正则元字符

正则:普通字符

当我们的正则表达式为一串普通字符(不包含元字符)时,校验字符串只有和正则一致时,才会校验通过。

具体效果如下:

910c5a43e487e733a4cf066d133024a3.png
图片

说明:后面例子为节省篇幅,不显得累赘,就不再贴代码,只贴校验结果。

正则:\d

\d 表示一个数字。

如:

  • aaa\d: 表示验证的字符串后面必须以 aaa 开头,且以一个数字结尾。

917e891e9898ade3c5878276c51d8168.png
图片
  • aaa\dbbb:aaa和bbb中间有一个数字

320f6619a1d9e95b2b5bbd119a6fd5a3.png
图片
  • aaa\d\d:aaa后面跟2个数字

9b32373a62c3ca70c9c83ca31a94e895.png
图片

注意:在Java定义的正则里,由于一个\表示的是字符串转义,因此在Java定义带有\的元字符时,还需要多写一个\,即\,至于其他语言,自己可查阅相关资料进行了解。

84551b05cd5cacc38e3125018d3cd193.png
图片

正则:\D

\D 表示一个非数字,它和上面 \d 的意思恰好相反。

如:

  • \D\D\D: 则表示一个长度为3,不包含数字的字符串。

1a5be7e911baf5326024f7e20d758920.png
图片
  • 111\D222:则表示111和222中间,必须包含一个非数字。

0db27fe2a3c4cadab753fe7d738395ed.png
图片

正则:\w

\w 表示一个字母(大小写均可)、数字,或下划线。

如:

  • 12\w45:则表示12和45中间必须是一个字母,数字,或下划线。

36752b529b484afcb2040f16060f7a4a.png
图片

正则:\W

\W 与 \w 相反,表示这个位置的字符既不是字母、数字,也不是下划线。

也就是:特殊符号(除下划线),或者空格等满足。

如:

  • 12\w45:则表示12和45中间是一个非字母,非数字,或非下划线。

4c22db03f362d0cae55137de314f0202.png
图片

正则:\s

\s 表示匹配一个看不见的符号,即空格或制表符(Tab键)

如:

  • 88\s99:则表示88和99中间须是一个空格或制表符。

由于我的编辑器设置了1个制表符替换为4个空格,所以这里就不列举制表符情况了

556b9429aa3627384642427473054452.png
图片

正则:\S

\S 与 \s 相反,表示一个可以看得见的符号。

如:

  • 88\S99:则表示88和99中间须有一个看得见的符号。

4c1279fbcf4a88bc4af327409b7bed25.png
图片

正则:.

. (小数点) 则表示“\n”和"\r"之外的任何单个字符。

如:

  • .... :则表示任意四个字符

bcf99a42678d2f3668dcfa4f120882ad.png
图片

正则:|

| (竖线) 则表示或的关系,表示检测的字符串须满足其中一个时,才符合条件。

如:

  • aa|bb|cc:则表示输入的字符串须是aa,或bb,或cc其中的一个。

17ea7abaaa83316a1231f13c77100add.png
图片

注意,如果我们或者关系的前后还有其它字符时,需要用()将他们包裹起来。

如:

  • xx(aa|bb|cc)yy:则表示输入的字符串须是xx开头,yy结尾,且中间是aa,或bb,或cc其中的一个。

1340eb5e22eb36ef27e4a300576d739b.png
图片

正则:[abc]

[ ] 表示匹配其中任意一个字符。

如:

  • a[bcd]e:则表示a和e的中间须是b,或c,或d其中的一个

14c51cbf23d6b3da28ca7910a3bdc032.png
图片

注意:用 | 表示其中之一,他可以是字符,也可以是字符串。而只用中括号时,则只表示其中一个字符。

正则:[^abc]

[^ ] 表示不与中括号里的任意字符匹配。

如:

  • a[^bcd]e:则表示a和e的中间除b,c,d这三个字符外,其他的字符都满足。

ab633ec826bbb1c391f2ebcefb35ed73.png
图片

正则:[a-z]

[值1-值2] 则表示值1到值2中间的所有字符都满足(包括值1和值2)。常用该正则来表示大小写字母范围,数字范围。

如:

  • a[b-d]e:等同于 a[bcd]e,因为 b-d 其实就是b,c,d三个数。

d54910e8b4377381c921fffeef2896df.png
图片
b53f9150387d89a38fb49ac1aa65c4df.png
图片
  • a[0-9]e:则表示a和e中间是一个数字,等同于 a\de(前面说过\d表示一个数字)

572bb1bf827a81953cabbe80a73e239a.png
图片
573ec9a9d78f64ed6f5c01bd858e6bae.png
图片

正则:[^a-z]

[^值1-值2] 则表示除值1和值2之外的所有字符,都可以满足。

如:

  • a[^1-3]e:则表示a和e中间的字符,只要不是1,2,3,则都满足。

4a610b840cfa88f2d2c29a072d52cf4a.png
图片

正则:\num

这里的num指number,也就是数字,当\后面跟数字,表示匹配第几个括号中的结果。

比如:现在有 abcd 字符串,当我们用小括号把 c 包裹起来后,然后在字符串后面写上 \1,即 ab(c)d\1,则这里的 \1 就指 c,因为 \1 表示第1个小括号中的结果。

  • ab(c)d\1:等同于 abcdc 。

d11f5eb56ae2305bea877062c1f0305d.png
图片

如果我们继续把 ab(c)d\1 中的 d 包括起来,并在后面写上 \2,即 ab(c)(d)\1\2, 那么这里的 \2 就表示 d 这个字符,因为第2个小括号的结果是 d,所以整个表达式就等同于 abcdcd 。

  • ab(c)(d)\1\2:等同于 abcdcd,也等同于 ab(cd)\1 。

503c7ed8fa55f408c79677fc7548c8a1.png
图片
685e7898ec716b77ef3f16c80c7769cb.png
图片

正则:?

? 表示匹配前面的子表达式零次或一次。

如:

  • abc?de: 表示可匹配的字符串为 abde (匹配0次c) 或 abcde (匹配1次c)。

13cf7a02fb16ff8ac6b4fdb8661b1adc.png
图片

正则:+

匹配前面的子表达式一次或多次 (次数 >= 1,即至少1次)

如:

  • abc+de:ab 和 de 之前至少有一个 c 。

70bd7ac219d643d933978fb72b306b9a.png
图片

正则:{n}

这里的 n 是一个非负整数。匹配确定的前面的子表达式 n 次。

如:

  • abc{3}de:表示 ab 和 de 之间有3个c。

2446a29e0f2faa185711645511e6ff0b.png
图片
  • ab(xx|yy){3}de:表示 ab 和 de 之间有 xx 或 yy 的个数, 一起合计为3个。

446fa9a464082240e970cc5cf8d77720.png
图片

正则:{n,m}

m和n均为非负整数,其中 n<=m。最少匹配 n 次且最多匹配 m 次。

如:

  • abc{2,3}de:表示 ab 和 de 之间有 2 到 3 个 c。

eb59c684fa0774ef22e0d215077fbfdc.png
图片

正则:*

表示匹配前面的子表达式任意次。

如:

  • abc*de:表示 ab 和 de 之间有任意个数(包括0)c 。

d132f289221c4aa626dbe41fde261805.png
图片
 
 

👉 欢迎加入小哈的星球 ,你将获得: 专属的项目实战 / Java 学习路线 / 一对一提问 / 学习打卡

目前, 正在星球内部带小伙伴做第一个项目:前后端分离博客,手摸手,后端 + 前端全栈开发,从 0 到 1 讲解每个功能点开发步骤,1v1 答疑,直到项目上线。目前已更新了94小节,累计13w+字,讲解图:630张,还在持续爆肝中.. 后续还会上新更多项目,如秒杀系统, 在线商城, IM即时通讯等,戳我加入学习,已有290+小伙伴加入(一顿饭钱)

 
 

93582474b359e3e169527b9334dbf2ac.png

 
  

1de2b8d5d97d3f9a6e4c624b7ab9b4cf.gif

 
  
 
  
 
  

1. 最值得加入的173家国企互联网汇总!!

2. 10 个 Java Stream 顶级技巧,大量简化代码!

3. SpringBoot 分布式验证码登录方案

4. 巧用 Redis,实现微博 Feed 流功能!

224744a9912eaa19ac09f3dc909f762f.gif

最近面试BAT,整理一份面试资料《Java面试BATJ通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。
获取方式:点“在看”,关注公众号并回复 Java 领取,更多内容陆续奉上。
PS:因公众号平台更改了推送规则,如果不想错过内容,记得读完点一下“在看”,加个“星标”,这样每次新文章推送才会第一时间出现在你的订阅列表里。
点“在看”支持小哈呀,谢谢啦
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值