正则表达式 Regular Express

Sophon、

已于 2022-03-18 16:35:49 修改

阅读量427

点赞数 1

分类专栏： Python 文章标签：正则表达式 python 字符串匹配

于 2022-03-18 16:35:25 首次发布

本文链接：https://blog.csdn.net/qq_55799677/article/details/123570349

版权

6 篇文章 0 订阅

订阅专栏

正则表达式可以被认为是一门语言，专门用来处理字符串匹配，其语法构成只有表达式。

正则表达式通过元字符进行排列组合来匹配字符串。
也可以通过简单字符来进行匹配，相当于字符串匹配。

元字符是具有固定含义的特殊符号。

常见元字符有：

量词

量词搭配元字符使用

* 表示待匹配内容出现0次或多次

\d*表示匹配一个或多个数字
+ 表示待匹配内容至少出现一次

.+表示至少出现一次数字或字母或下划线
? 表示待匹配内容出现0次或1次
{n} 表示待匹配内容出现n次

\d{11}匹配一个11位数字，可以用来匹配电话号码
匹配一个9位或11位的qq号："^(\d{9}|\d{11})$"
{n,} 表示待匹配内容出现至少n次
{n,m} 表示待匹配内容出现n次至m次

不同语言对正则表达式有不同的接口，方便我们使用。这里使用Python中的re模块(regular express缩写)，处理正则表达式进行匹配。

re.search(pattern,string)
接收一个正则表达式pattern和字符串string返回一个对象re.Match使用成员方法group()可以取出匹配到的内容。

特点：匹配到一个就返回。

resp = re.search(r'\d*\.{1}\d+',"p3.1415926")

print(resp.group()) # 输出: 3.1415926

re.match(pattern,string)
接收一个正则表达式pattern和字符串string返回一个对象re.Match使用成员方法group()可以取出匹配到的内容。

特点：从字符串头开始匹配，匹配到一个就返回。

resp = re.match(r'\d*\.{1}\d+',"p3.1415926")

print(resp) # 从头开始匹配无法匹配到值 输出:None

re.findall(pattern,string)
接收一个正则表达式pattern和字符串string返回一个list放有所有符合表达式的结果串。

特点：返回所有。

resp = re.findall(r'\d',"1a2b3c4d--")

print(resp) # 输出:1234

re.finditer(pattern,string)
接收一个正则表达式pattern和字符串string返回一个可迭代对象使用for循环可以发现取出的每一项都是一个对象re.Match。

特点：返回一个可迭代对象。

resp = re.finditer(r'\d',"1a2b3c4d--")

for item in resp:
    print(item.group())
"""
输出:
1
2
3
4
"""

关注