年月日正则_正则表达式进级

最新推荐文章于 2024-04-30 16:09:17 发布

蜜桃不吃菠萝

最新推荐文章于 2024-04-30 16:09:17 发布

阅读量346

点赞数

文章标签：年月日正则

本文链接：https://blog.csdn.net/weixin_29418485/article/details/112670835

版权

本篇内容分组、回溯

看一下用分组提取手机号、IP、html标签中的响应数据

贪婪和懒惰

贪婪是尽可能的多

懒惰是尽可能的少

贪婪匹配和懒惰匹配影响的是正则表达式的限定符的匹配结果；

在限定符后面加上?，则为懒惰模式；在限定符后面不加?，则为贪婪模式；

有些学校的学号是由多个关键信息组成的，例如：`2019-5013-08` `2019`表示入学年份，`5013`表示班级代码，`08`表示班级中的排序。

接下来编写正则表达式匹配不同格式的学号，并将其中的关键信息用分组提取出来，需要分成三个分组。

使用分组的时候，可以使用或者条件：各个后缀名之间加上一个 | 符号

提取视频

提取图片

并不需要捕获某个分组的内容，但又使用分组的特性。可以使用非捕获组(?:表达式)，从而不捕获数据，还能使用分组的功能。

提取目标数据中的电话号码:75855

多格式年月日的提取

[-./\s]表示匹配三个可能出现的分隔符-./和空白，?表示匹配它们0次或者1次，其他年月日的数据使用\d{N}与分组结合就可以提取到目标数据。

运用也有正则表达式知识，去操作标签语言的时候。

上图可知在标签不一样的时候是无法进行辨识的。

回溯，就是要求和之前分组一样。

(.*?)\1>中有两个分组，\1表示第一个分组。

上图的练习内容可以看到是ABBA型，\2表示第二个分组。

上图的练习内容可以看到是AB【C】【D】AB【C】【D】型。

关注