Python正则表达式

最新推荐文章于 2024-09-08 20:15:55 发布

Python小行家

最新推荐文章于 2024-09-08 20:15:55 发布

阅读量258

点赞数

文章标签： python

本文链接：https://blog.csdn.net/weixin_45719624/article/details/102897612

版权

Python正则表达式
正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。

re 模块使 Python 语言拥有全部的正则表达式功能。

compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。

re 模块也提供了与这些方法功能完全一致的函数，这些函数使用一个模式字符串做为它们的第一个参数。

本章节主要介绍Python中常用的正则表达式处理函数。

re.match函数
re.match 尝试从字符串的开始匹配一个模式。

函数语法：

re.match(pattern, string, flags=0)
函数参数说明：
在这里插入图片描述
匹配成功re.match方法返回一个匹配的对象，否则返回None。

我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。
在这里插入图片描述
实例：

#!/usr/bin/python
import re

line = “Cats are smarter than dogs”

matchObj = re.match( r’(.) are (.?) .*’, line, re.M|re.I)

matchObj.group() : Cats are smarter than dogs
matchObj.group(1) : Cats
matchObj.group(2) : smarter
re.search方法
re.search 会在字符串内查找模式匹配，直到找到第一个匹配。

函数语法：

re.search(pattern, string, flags=0)
函数参数说明：在这里插入图片描述
匹配成功re.search方法返回一个匹配的对象，否则返回None。

我们可以使用group(num) 或 groups() 匹配对象函数来获取匹配表达式。
在这里插入图片描述

实例：

#!/usr/bin/python
import re

line = “Cats are smarter than dogs”;

matchObj = re.match( r’(.) are (.?) .*’, line, re.M|re.I)

if matchObj:
print "matchObj.group() : ", matchObj.group()
print "matchObj.group(1) : ", matchObj.group(1)
print "matchObj.group(2) : ", matchObj.group(2)
else:
print “No match!!”
以上实例执行结果如下：
matchObj.group() : Cats are smarter than dogs
matchObj.group(1) : Cats
matchObj.group(2) : smarter
re.match与re.search的区别
re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而re.search匹配整个字符串，直到找到一个匹配。

实例：

#!/usr/bin/python
import re

line = “Cats are smarter than dogs”;

matchObj = re.match( r’dogs’, line, re.M|re.I)
if matchObj:
print "match --> matchObj.group() : ", matchObj.group()
else:
print “No match!!”

matchObj = re.search( r’dogs’, line, re.M|re.I)
if matchObj:
print "search --> matchObj.group() : ", matchObj.group()
else:
print “No match!!”
以上实例运行结果如下：
No match!!
search --> matchObj.group() : dogs
检索和替换
Python 的re模块提供了re.sub用于替换字符串中的匹配项。

语法：

re.sub(pattern, repl, string, max=0)
返回的字符串是在字符串中用 RE 最左边不重复的匹配来替换。如果模式没有发现，字符将被没有改变地返回。

可选参数 count 是模式匹配后替换的最大次数；count 必须是非负整数。缺省值是 0 表示替换所有的匹配。

实例：

#!/usr/bin/python
import re

phone = “2004-959-559 # This is Phone Number”

Delete Python-style comments

num = re.sub(r’#.*$’, “”, phone)
print "Phone Num : ", num

Remove anything other than digits

num = re.sub(r’\D’, “”, phone)
print "Phone Num : ", num
以上实例执行结果如下：
Phone Num : 2004-959-559
Phone Num : 2004959559
正则表达式修饰符 - 可选标志
正则表达式可以包含一些可选标志修饰符来控制匹配的模式。修饰符被指定为一个可选的标志。多个标志可以通过按位 OR(|) 它们来指定。如 re.I | re.M 被设置成 I 和 M 标志：在这里插入图片描述
正则表达式模式
模式字符串使用特殊的语法来表示一个正则表达式：