Python的模式匹配

最新推荐文章于 2024-05-10 11:24:14 发布

TravisZeng

最新推荐文章于 2024-05-10 11:24:14 发布

阅读量8k

点赞数 1

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/qq_34841823/article/details/52840189

版权

python 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

python中常常使用正则表达式来帮助程序员建立一个符合自己想查找的模式，以帮助在文本中匹配想要的文本模式。

1.正则表达式匹配步骤：

（1）用import re来导入正则表达式的模块

（2）用re.compile()函数创建一个Regex对象。（使用原始字符串）

（3）向Regex对象的search()方法传入想查找的字符串，它返回一个Match对象

（4）调用Match对象的group()方法，返回实际匹配文本的字符串。

例如：

import re 
phoneNumberRegex = re.compile(r'\d{3}-\d{3}-\d{4}')
mo1=phoneNumberRegex.search('my phone number is 010-123-4567')
mo1.group()

2.利用括号分组：

添加括号将在正则表达式中创建分组，正则表达式字符串中的第一对括号是第一组，第二对括号是第二组。向group()方法传入整数1或者2，可以得到匹配文本的不同部分。向group()方法传入0或不传入参数，将返回整个匹配的文本。

phoneNumberRegex = re.compile(r'(\d{3})-(\d{3})-(\d{4})')
mo1=phoneNumberRegex.search('my phone number is 010-123-4567')
mo1.group(1)                              ------>'010'

如果向以此获取所有分组，则使用groups()方法。groups()方法将会返回多个值的元组。

phoneNumberRegex = re.compile(r'(\d{3})-(\d{3})-(\d{4})')
mo1=phoneNumberRegex.search('my phone number is 010-123-4567')
mo1.groups()                              ------>('010','123','4567')

3.用‘|’匹配多个分组：

当希望匹配许多表达式中的一个时候，可以使用'|'来表示或者。如果多个表达式都出现在字符串中，则第一次出现的匹配文本将作为Match对象返回。

4.用'?'实现可选匹配：

？表示前面的分组在这个模式中是可选的，即该分组允许在该正则表达式匹配的文本中出现零次或者一次。

5.用'*'实现零次或多次匹配：

*表示其前面的分组可以在文本中出现零次或多次。

6.用'+'实现一次或多次匹配：

+表示其前面的分组至少在文本中出现一次。

7.用花括号匹配特定次数：

如果想要一个分组重复特定次数，则在正则表达式中该分组的后面，跟上花括号包围的数字。

除了一个数字，还可以指定一个范围，写下最大值和最小值，还可以只给定上限或者只给下限。

8.贪心策略：