正则的详细讲解(一)
正则介绍
那么什么是正则?
说起正则,相信大部分小伙伴都听说过,有部分小伙伴还经常使用。
正则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。
正则到低有什么用呢?
咱们正常的登录功能,手机号登录,因为手机号的可能是移动、联调、电信,而且手机号数量很多,我们怎么去识别用户输入的是数字的,这时我们用正则去匹配就很方便。还有,爬虫爬取完信息,需要对信息进行提取,这时就可以用正则进行匹配,还有我们测试时,接口自动化时,后面接口需要前面接口的返回的某个值,我们这时可以用正则去匹配等等,正则的用处很多,我们学会正则,我们的工作会很方便。
因为我喜欢用python,所以后面正则就以python的re模块就行讲解
正则匹配流程
简单举个列子:
re属于python的内置模块,import 直接引用就可以。
compile(里面写正则表达试) 函数用于编译正则表达式,生成一个 Pattern 对象
有了pattern,我们就可以运用一些方法,对文本就行匹配了。
Pattern 对象的一些常用方法主要有:
· match 方法:从起始位置开始查找,一次匹配
· search 方法:从任何位置开始查找,一次匹配
· findall 方法:全部匹配,返回列表
· finditer 方法:全部匹配,返回迭代器
· split 方法:分割字符串,返回列表
· sub 方法:替换
match 方法返回的是一个match 对象,需要用group方法用于获得一个或多个分组匹配的字符串,当要获得整个匹配的子串时,可直接使用 group() 或 group(0)
Python中字符串前面加上 r 表示原生字符串,与大多数编程语言相同,正则表达式里使用""作为转义字符,这就可能造成反斜杠困扰。
是不是用“r”更方便,有了原始字符串,你再也不用担心是不是漏写了反斜杠,写出来的表达式也更直观。
大家可以看下面的这一张图:
我们可以根据上面的那个简单的的例子 来理解这图
import re 引用正则的模块,pattern = re.compile(r’www.baidu’)我们通过compile填入正则的表达试。得到pattren对象,我们通过match (输入需要匹配的文本)方法进行匹配,得到一个match对象,用group方法进行获取匹配的结果。
这就是正则整个匹配的过程,剩下的就是我们运行正则的方法去匹配我们的文本,最后得到我们想要的结果。
总结
正则就是通过正则表达式,得到正则表示对象,通过匹配的文本,最后我们得到匹配结果。学会,正则,后面我们的工作将会很方便,后面,我会仔细讲解正则的用法。
注:以上仅个人见解,如有不对,请指正,谢谢。