python3的正则表达式

最新推荐文章于 2022-03-12 11:40:17 发布

ThinkTimes

最新推荐文章于 2022-03-12 11:40:17 发布

阅读量846

点赞数 1

分类专栏： python3 文章标签：正则表达式

本文链接：https://blog.csdn.net/ThinkTimes/article/details/107104165

版权

python3 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一、python3的正则表达式使用流程。

用import re 导入正则表达式模块。
用re.compile()函数创建一个Regex对象（记得使用原始字符串）。
向Regex对象的search()方法传入想查找的字符串。它返回一个Match对象。
调用Match对象的group()方法，返回实际匹配文本的字符串。

import re
phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')
mo = phoneNumRegex.search('My number is 415-555-4242.')
print('Phone number found: ' + mo.group())

#运行结果：415-555-4242

注：Regex对象的search（）方法只找到字符串中出现的第一个符合正则表达式的部分，如果想要找到所有符合正则表达式的部分，可以用findall（）方法，findall()方法返回一个列表。

import re
phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')
numList = phoneNumRegex.findall('Cell: 415-555-9999 Work: 212-555-0000')
for num in numList:
    print(num)

#运行结果
#415-555-9999
#212-555-0000

二、正则表达式的规则

1、利用括号分组(\d\d\d)-(\d\d\d-\d\d\d\d)。然后可以使用group()匹配对象方法，从一个分组中获取匹配的文本。正则表达式字符串中的第一对括号是第1组。第二对括号是第2组。向group()匹配对象方法传入整数1或2，就可以取得匹配文本的不同部分。向group()方法传入0或不传入参数，将返回整个匹配的文本。

import re
phoneNumRegex = re.compile(r'(\d\d\d)-(\d\d\d-\d\d\d\d)')
mo = phoneNumRegex.search('My number is 415-555-4242.')
print(mo.group(1)) #结果415
print(mo.group(2)) #结果555-4242
print(mo.group(0)) #结果415-555-4242
print(mo.group()) #结果415-555-4242

2、用管道匹配多个分组。字符|称为“管道”。希望匹配许多表达式中的一个时，就可以使用它。例如，
正则表达式r'Batman|Tina Fey'将匹配'Batman'或'Tina Fey'。

import re
heroRegex = re.compile (r'Batman|Tina Fey')
mo1 = heroRegex.search('Batman and Tina Fey.')
print(mo1.group()) #运行结果Batman

3、用问号实现可选匹配。字符?表明它前面的分组在这个模式中是可选的。

import re
batRegex = re.compile(r'Bat(wo)?man')
mo1 = batRegex.search('The Adventures of Batman')
print(mo1.group())
#运行结果：Batman
mo2 = batRegex.search('The Adventures of Batwoman')
print(mo2.group())
#运行结果：Batwoman

4、用星号匹配零次或多次。*意味着“匹配零次或多次”，即星号之前的分组。

5、用加号匹配一次或多次。+意味着“匹配一次或多次”

import re
batRegex = re.compile(r'Bat(wo)*man')
mo1 = batRegex.search('The Adventures of Batman')
print(mo1.group())
#运行结果：Batman

mo2 = batRegex.search('The Adventures of Batwoman')
print(mo2.group())
#运行结果：Batwoman

mo3 = batRegex.search('The Adventures of Batwowowowoman')
print(mo3.group())
#运行结果：Batwowowowoman

bat2Regex = re.compile(r'Bat(wo)+man')
moo2 = bat2Regex.search('The Adventures of Batwowowowoman')
print(moo2.group())
#运行结果：Batwowowowoman

mooo3 = bat2Regex.search('The Adventures of Batman')
print(mooo3 == None)
#运行结果：True

6、用花括号匹配特定次数。正则表达式(Ha){3}将匹配字符串'HaHaHa'，但不会匹配'HaHa'，
因为后者只重复了(Ha)分组两次

import re
haRegex = re.compile(r'(Ha){3}') 
mo1 = haRegex.search('HaHaHa') 
mo1.group() 
'HaHaHa'

ThinkTimes

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python3的正则表达式

一、python3的正则表达式使用流程。用import re 导入正则表达式模块。用re.compile()函数创建一个Regex对象（记得使用原始字符串）。向Regex对象的search()方法传入想查找的字符串。它返回一个Match对象。调用Match对象的group()方法，返回实际匹配文本的字符串。import rephoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')mo = phoneNumRegex.search...
复制链接

扫一扫