正则的详细讲解(一)

正则介绍

那么什么是正则?

说起正则,相信大部分小伙伴都听说过,有部分小伙伴还经常使用。
正则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。

正则到低有什么用呢?

咱们正常的登录功能,手机号登录,因为手机号的可能是移动、联调、电信,而且手机号数量很多,我们怎么去识别用户输入的是数字的,这时我们用正则去匹配就很方便。还有,爬虫爬取完信息,需要对信息进行提取,这时就可以用正则进行匹配,还有我们测试时,接口自动化时,后面接口需要前面接口的返回的某个值,我们这时可以用正则去匹配等等,正则的用处很多,我们学会正则,我们的工作会很方便。

因为我喜欢用python,所以后面正则就以python的re模块就行讲解

正则匹配流程

简单举个列子:
在这里插入图片描述re属于python的内置模块,import 直接引用就可以。
compile(里面写正则表达试) 函数用于编译正则表达式,生成一个 Pattern 对象
有了pattern,我们就可以运用一些方法,对文本就行匹配了。

Pattern 对象的一些常用方法主要有:

· match 方法:从起始位置开始查找,一次匹配
· search 方法:从任何位置开始查找,一次匹配
· findall 方法:全部匹配,返回列表
· finditer 方法:全部匹配,返回迭代器
· split 方法:分割字符串,返回列表
· sub 方法:替换

match 方法返回的是一个match 对象,需要用group方法用于获得一个或多个分组匹配的字符串,当要获得整个匹配的子串时,可直接使用 group() 或 group(0)

Python中字符串前面加上 r 表示原生字符串,与大多数编程语言相同,正则表达式里使用""作为转义字符,这就可能造成反斜杠困扰。

在这里插入图片描述
是不是用“r”更方便,有了原始字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。

大家可以看下面的这一张图:
在这里插入图片描述
我们可以根据上面的那个简单的的例子 来理解这图
import re 引用正则的模块,pattern = re.compile(r’www.baidu’)我们通过compile填入正则的表达试。得到pattren对象,我们通过match (输入需要匹配的文本)方法进行匹配,得到一个match对象,用group方法进行获取匹配的结果。
这就是正则整个匹配的过程,剩下的就是我们运行正则的方法去匹配我们的文本,最后得到我们想要的结果。

总结

正则就是通过正则表达式,得到正则表示对象,通过匹配的文本,最后我们得到匹配结果。学会,正则,后面我们的工作将会很方便,后面,我会仔细讲解正则的用法。
注:以上仅个人见解,如有不对,请指正,谢谢。

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值