2021-01-01

最新推荐文章于 2021-03-14 15:26:30 发布

m0_52873697

最新推荐文章于 2021-03-14 15:26:30 发布

阅读量54

点赞数

分类专栏：笔记

本文链接：https://blog.csdn.net/m0_52873697/article/details/112061466

版权

笔记专栏收录该内容

18 篇文章 0 订阅

订阅专栏

#!/usr/bin/python
import re
print(re.match(‘www’, ‘www.runoob.com’).span()) # 在起始位置匹配
print(re.match(‘com’, ‘www.runoob.com’)) # 不在起始位置匹配
以上实例运行输出结果为：

(0, 3)
None
实例
#!/usr/bin/python
import re

line = “Cats are smarter than dogs”

matchObj = re.match( r’(.) are (.?) .*’, line, re.M|re.I)

if matchObj:
print "matchObj.group() : ", matchObj.group()
print "matchObj.group(1) : ", matchObj.group(1)
print "matchObj.group(2) : ", matchObj.group(2)
else:
print “No match!!”
以上实例执行结果如下：

matchObj.group() : Cats are smarter than dogs
matchObj.group(1) : Cats
matchObj.group(2) : smarter
re.search方法
re.search 扫描整个字符串并返回第一个成功的匹配。

函数语法：

re.search(pattern, string, flags=0)
#!/usr/bin/python# -- coding: UTF-8 --

import re
print(re.search(‘www’, ‘www.runoob.com’).span()) # 在起始位置匹配
print(re.search(‘com’, ‘www.runoob.com’).span()) # 不在起始位置匹配
以上实例运行输出结果为：

(0, 3)
(11, 14)
实例
#!/usr/bin/python
import re

line = “Cats are smarter than dogs”;

searchObj = re.search( r’(.) are (.?) .*’, line, re.M|re.I)

if searchObj:
print "searchObj.group() : ", searchObj.group()
print "searchObj.group(1) : ", searchObj.group(1)
print "searchObj.group(2) : ", searchObj.group(2)
else:
print “Nothing found!!”
以上实例执行结果如下：
searchObj.group() : Cats are smarter than dogs
searchObj.group(1) : Cats
searchObj.group(2) : smarter
re.match与re.search的区别
re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而re.search匹配整个字符串，直到找到一个匹配。

实例
#!/usr/bin/python
import re

line = “Cats are smarter than dogs”;

matchObj = re.match( r’dogs’, line, re.M|re.I)
if matchObj:
print "match --> matchObj.group() : ", matchObj.group()
else:
print “No match!!”

matchObj = re.search( r’dogs’, line, re.M|re.I)
if matchObj:
print "search --> searchObj.group() : ", matchObj.group()
else:
print “No match!!”
以上实例运行结果如下：
No match!!
search --> searchObj.group() : dogs
检索和替换
Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。

语法：

re.sub(pattern, repl, string, count=0, flags=0)
参数：

pattern : 正则中的模式字符串。
repl : 替换的字符串，也可为一个函数。
string : 要被查找替换的原始字符串。
count : 模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。
实例
#!/usr/bin/python# -- coding: UTF-8 --

import re

phone = “2004-959-559 # 这是一个国外电话号码”

删除字符串中的 Python注释

num = re.sub(r’#.*$’, “”, phone)
print "电话号码是: ", num

删除非数字(-)的字符串

num = re.sub(r’\D’, “”, phone)
print "电话号码是 : ", num
以上实例执行结果如下：
电话号码是: 2004-959-559
电话号码是 : 2004959559
repl 参数是一个函数
以下实例中将字符串中的匹配的数字乘以 2：

实例
#!/usr/bin/python# -- coding: UTF-8 --

import re

将匹配的数字乘以 2

def double(matched):
value = int(matched.group(‘value’))
return str(value * 2)

s = ‘A23G4HFD567’
print(re.sub(’(?P\d+)’, double, s))
执行输出结果为：

A46G8HFD1134
re.compile 函数
compile 函数用于编译正则表达式，生成一个正则表达式（ Pattern ）对象，供 match() 和 search() 这两个函数使用。

语法格式为：

re.compile(pattern[, flags])
参数：

pattern : 一个字符串形式的正则表达式

flags : 可选，表示匹配模式，比如忽略大小写，多行模式等，具体参数为：

re.I 忽略大小写
re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
re.M 多行模式
re.S 即为 . 并且包括换行符在内的任意字符（. 不包括换行符）
re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
re.X 为了增加可读性，忽略空格和 # 后面的注释
实例
实例

import re
pattern = re.compile(r’\d+’) # 用于匹配至少一个数字
m = pattern.match(‘one12twothree34four’) # 查找头部，没有匹配
print m
None

m = pattern.match(‘one12twothree34four’, 2, 10) # 从’e’的位置开始匹配，没有匹配
print m
None

m = pattern.match(‘one12twothree34four’, 3, 10) # 从’1’的位置开始匹配，正好匹配
print m # 返回一个 Match 对象
<_sre.SRE_Match object at 0x10a42aac0>

m.group(0) # 可省略 0
‘12’

m.start(0) # 可省略 0
3

m.end(0) # 可省略 0
5

m.span(0) # 可省略 0
(3, 5)
在上面，当匹配成功时返回一个 Match 对象，其中：

group([group1, …]) 方法用于获得一个或多个分组匹配的字符串，当要获得整个匹配的子串时，可直接使用 group() 或 group(0)；
start([group]) 方法用于获取分组匹配的子串在整个字符串中的起始位置（子串第一个字符的索引），参数默认值为 0；
end([group]) 方法用于获取分组匹配的子串在整个字符串中的结束位置（子串最后一个字符的索引+1），参数默认值为 0；
span([group]) 方法返回 (start(group), end(group))。

m0_52873697

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-01-01

#!/usr/bin/pythonimport reprint(re.match(‘www’, ‘www.runoob.com’).span()) # 在起始位置匹配print(re.match(‘com’, ‘www.runoob.com’)) # 不在起始位置匹配以上实例运行输出结果为：(0, 3)None实例#!/usr/bin/pythonimport reline = “Cats are smarter than dogs”matchObj = re.mat
复制链接

扫一扫