Python 正则表达式之 补充学习笔记

  1. search和match区别
re. search ( pattern , string [ , flags ] )
Scan through string looking for a location where the regular expression pattern produces a match, and return a corresponding MatchObject instance. Return None if no position in the string matches the pattern; note that this is different from finding a zero-length match at some point in the string.
re. match ( pattern , string [ , flags ] )

If zero or more characters at the beginning of string match the regular expression pattern , return a corresponding MatchObject instance. Return None if the string does not match the pattern; note that this is different from a zero-length match.

 

例子:

>>> print(re.search('super','ddsuper').span())
(2, 7)
>>> print(re.match('super','ddsuper'))
None

 

search会查找整个字符串,而match只会在字符串的开始进行匹配

 

2 正则表达式常见的符号和特殊字符表。

 

 


3关于单词匹配边界:

 

特殊字符 /b and /B 用来匹配单词边界。两者之间的区别是,/b 匹配的模式是一个单词边界,
就是说,与之对应的模式一定在一个单词的开头,不论这个单词的前面是有字符(该词在一个字符串
的中间),还是没有字符(该单词在一行的起始处)。同样地,/B 只匹配出现在一个单词中间的模式(即,
不在单词边界上的字符)。看下面几个例子:
RE Pattern Strings Matched
the 任何包含有"the"的字符串
/bthe 任何以"the"开始的字符串
/bthe/b 仅匹配单词 “the”
/Bthe 任意包含“the”但不以“the”开头的单词


4 re常见的函数和方法:

函数/方法 描述
re 模块的函数
compile(pattern,flags=0) 对正则表达式模式pattern 进行编译,flags 是可选标志符,
并返回一个regex 对象

match(pattern,string, flags=0) 尝试用正则表达式模式pattern 匹配字符串string,

flags 是可选标志符,如果匹配成功,则返回一个匹配对象;否则返回None


search(pattern,string, flags=0) 在字符串string 中查找正则表达式模式pattern 的第
一次出现,flags 是可选标志符,如果匹配成功,则返回一个匹配对象;否则返回None


findall(pattern,string[,flags])a 在字符串string 中查找正则表达式模式pattern 的所有
(非重复)出现;返回一个匹配对象的列表


finditer(pattern,string[, flags])b 和findall()相同,但返回的不是列表而是迭代器;对
于每个匹配,该迭代器返回一个匹配对象

函数/方法 描述
匹配对象的方法
split(pattern,string, max=0) 根据正则表达式pattern 中的分隔符把字符string 分割
为一个列表,返回成功匹配的列表,最多分割max 次(默认是分割所有匹配的地方)。


sub(pattern, repl, string, max=0) 把字符串string 中所有匹配正则表达式pattern 的地方替换成字符串repl,如果max 的值没有给出,则对所有匹配的地方进行替换(另外,请参考subn(),它还会返回一个表示替换次数的数值)。


group(num=0) 返回全部匹配对象(或指定编号是num 的子组)


groups() 返回一个包含全部匹配的子组的元组(如果没有成功匹配,就返回一个空元组)

 

 

findall()和search()相似之处 在于二者都执行字符串搜索,但findall()和match()与
search()不同之处是,findall()总返回一个列表。如果findall()没有找到匹配的部分,会返回空
列表;如果成功找到匹配部分,则返回所有匹配部分的列表(按从左到右出现的顺序排列)

 

用sub()[和 subn()]进行搜索和替换

有两种函数/方法用于完成搜索和代替的功能: sub()和subn(). 二者几乎是一样的,都是将某字符串中所有匹配正则表达式模式的部分进行替换。用来替换的部分通常是一个字符串,但也可能
是一个函数,该函数返回一个用来替换的字符串。subn()和sub()一样,但它还返回一个表示替换次
数的数字,替换后的字符串和表示替换次数的数字作为一个元组的元素返回。
>>> re.sub('X', 'Mr. Smith', 'attn: X/n/nDear X,/n')
'attn: Mr. Smith/012/012Dear Mr. Smith,/012'
>>>
>>> re.subn('X', 'Mr. Smith', 'attn: X/n/nDear X,/n')
('attn: Mr. Smith/012/012Dear Mr. Smith,/012', 2)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

惹不起的程咬金

来都来了,不赏点银子么

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值