正则表达式入门学习

最新推荐文章于 2020-12-04 17:59:05 发布

嗷嗷_

最新推荐文章于 2020-12-04 17:59:05 发布

阅读量176

点赞数

分类专栏：算法学习 python学习文章标签：正则表达式

本文链接：https://blog.csdn.net/qq_35218635/article/details/107778327

版权

python学习同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

算法学习

9 篇文章 0 订阅

订阅专栏

正则表达式是什么： 在编写处理字符串的程序或网页时，经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说，正则表达式就是记录文本规则的代码。

https://regexr-cn.com/

https://www.codejiaonang.com/#/ 这个练习网站写的很好，也很适合用来回忆和查询正则表达式的规则

https://codejiaonang.com/#/course/regex_chapter2/0/0 进阶课程

还想进一步深入了解使用学习的，还可以看这个网站进行相关知识补充：https://deerchao.cn/tutorials/regex/regex.htm

常用的通配符：

单个字符匹配：

. 可用于匹配除了回车换行以外的任意一个字符,它只能出现在方括号以外。

值得注意的是： .字符只有一个不能匹配的字符，也就是换行符（\n），不过要让.字符与换行符匹配也是可以的，以后会讨论。

[ ] 可用于匹配包含在方括号内的任意一个字符，且里面都是或的关系，比如[abcd]也就是abcd都会有可能被匹配到

使用[ ]来进行字符匹配，匹配中括号内的元素任意一次，例如：[Pp]ython 就是可以匹配下面三种字符串：

[^ ] 表示取反，可用于匹配除了方括号以外的任何字符，例如：[^abcd]可以匹配到除了abcd以外的任意字符

- 这个符号可以表示范围

[a-z] 匹配所有的小写字符

[A-Z] 匹配所有的大写字符

[0-9] 匹配所有的数字

[a-zA-Z0-9] 可以匹配括号内写的所有字符

但是上面的写法太复杂，可以进行简写：

使用\w表示所有的字母字符，\d代表所有的数字字符，\s表示所有的空白字符，比如空格、tab、换行等。

记忆方法：word（单词） digital(数字) space(空格)

\b可以匹配单词的边界，也就是被前后都有\b包围的单词要作为一个完整的单词才会被匹配。

同样地，快捷方式也是可以取反的，取反的时候只要把原来的小写字母改成大写字母就可以了，具体见下图：

多个字符匹配：

匹配数量控制表示法：

*表示：匹配0个或者n个*前面的字符例如： a* 表示匹配0个a或者n个a 如果被匹配字符串是bbbbbb, 那么也会被匹配，只是被匹配到的是最开始的b前面的那个空白缝隙如果是ab*匹配的是空，a或者ab，或者abb....

+表示：匹配1个或n个前面的字符,例如ab+表示匹配ab或者abb或者更多

？表示：匹配0个或者1个前面的字符，例如ab?匹配的是a或者ab，也就是？表示问号前面出现的字符是可选字符，可以选择出现也可以选择不出现，即出现0次或1次。 ? 符号指定一个字符、字符组或其他基本单元可选，这意味着正则表达式引擎将会期望该字符出现零次或一次。

* + ？是修饰前一个字符的，所以如果你看到* + ？任意有出现在一起的情况一定是一个错误的表达式

如果像匹配到特定数量的字符，可以使用{ }, 比如：a{2}表示匹配两个a, 如果想匹配两个以上的a，可以加一个，像这样写：a{2,} 如果想匹配两个到四个a，可以这样写：a{2,4}

.可以表示任意字符，但是它只能出现在方括号以外，.字符只有一个不能匹配的字符，也就是换行符（\n）,不过如果想让.字符和换行符匹配也是可以的。

例如：

重复：

在一个字符组后加上`{N}` 就可以表示在它之前的字符组出现`N`次。

\d{9}表示重复9次，也就是需要匹配9个数字。{ }中表示的是重复次数。

重复区间：可能有时候，我们不知道具体要匹配字符组要重复的次数，比如身份证有15位也有18位的。这里重复区间就可以出场了，语法：{M,N}，M是下界而N是上界。

\d{8,9}表示既可以匹配连续的8个数字，也可以匹配连续的9个数字，但是由于正则表达式默认是贪婪的，所以当有连续的九个数字的时候就不会匹配八个数字了。但是这个时候可以通过问号来解决，问号可以去除正则表达式默认的贪婪，从而处于非贪婪模式，让它在出现上面那种情况的时候只匹配8个数字，也就是这种写法： \d{8,9}?

有时候遇到的字符组的重复次数也会没有边界，闭区间不写即可表示匹配一个或无数个。例如： \d{1, } 这样就表示匹配一个及以上个数的数字：