Python 正则表达式的使用

正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本,Python使用re模块来处理正则表达式。

一、正则表达式
1、通配符
句点 . 与除换行符外的任何字符都匹配,并且只与一个字符匹配。
例如正则表达式'.ython'与字符串'python'匹配,不与'cpython'或'ython'匹配。
2、特殊字符转义
用两个反斜杠转义,如果用单个反斜杠,则前面字符串加r。
例如模式'python\\.org',或r'python\.org'匹配字符串'python.org'。
3、字符集
字符集用方括号将一个子串括起,字符集只能匹配一个字符,如 '[pj]ython'与'python'和'jython'都匹配;
也可以使用用范围,如'[a-zA-Z0-9]'与大写字母、小写字母和数字都匹配;
要指定排除字符集,在开头添加一个^字符,如'[^ab]'与除a、b外的其他任何字符都匹配。
4、二选一和子模式
使用管道字符 | 表示匹配两个中的一个 ,如'python|perl' 匹配'python'和'perl'。
如果只想将 | 用于模式的一部分,可将这部分(子模式)放在圆括号内。如'p(ython|erl)'。
单个字符也可称为子模式。
5、字符串的开头和结尾
开头用脱字符 ^,结尾用美元符号 $。
6、可选模式和重复模式
在子模式后面加上指定符号 ,可指定可选和重复模式。
(pattern)? : pattern可重复0、1
(pattern)* : pattern可重复0、1或多次
(pattern)+ : pattern可重复1或多次
(pattern){m,n} : pattern可重复m至n次
重复运算符默认是贪婪的,匹配尽可能多的内容。
如r'\*(.+)\*'匹配字符串 '*This* is *it*!'时将匹配到*This* is *it*
在重复运算符后面加问号?可指定为非贪婪的,
如r'\*(.+?)\*'匹配字符串 '*This* is *it*!'时将匹配到*This* 和 *it*

二、模板re包含使用正则表达式的函数。

1、search(pattern, string[, flags])

(1)在给定字符串查找第一个与正则表达式匹配的子串,如果找到将返回MatchObject对象(结果为真),否则返回None(结果为假)
参数 pattern 为正则表达式,string 为要匹配的字符串,flags为标志位,控制是否区分大小写等等。
(2)MatchObject对象
MatchObject对象包含与模式匹配的子串的信息,这些子串部分称为编组。
编组就是放在圆括号内的子模式,根据左边的括号数编号,其中编组0指的是整个模式。
MatchObject对象的几个重要方法
groups() 返回一个包含所有编组字符串的元组,从 1 到 所含的编组,不包含编组0。
group([group1, ...]) 获取与给定子模式(编组)匹配的子串,没有指定编组号则默认为0
start([group]) 返回与给定编组匹配的子串的起始位置
end([group]) 返回与给定编组匹配的子串的终止位置(与切片一样不包含终止位置)
span([group]) 返回与给定编组匹配的子串的起始位置和终止位置

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值