Python 正则高级运用

最新推荐文章于 2024-09-17 23:15:58 发布

hanson-leung

最新推荐文章于 2024-09-17 23:15:58 发布

阅读量696

点赞数

分类专栏： Python 文章标签： python import c search xp

本文链接：https://blog.csdn.net/liangguohuan/article/details/7088974

版权

Python 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

常用函数
match()       决定 RE 是否在字符串刚开始的位置匹配
search()       扫描字符串，找到这个 RE 匹配的位置
findall()       找到 RE 匹配的所有子串，并把它们作为一个列表返回
finditer()   找到 RE 匹配的所有子串，并把它们作为一个迭代器返回

修饰符：上面函数第三个参数
DOTALL, S    使 . 匹配包括换行在内的所有字符
IGNORECASE, I    使匹配对大小写不敏感
LOCALE, L    做本地化识别（locale-aware）匹配
MULTILINE, M    多行匹配，影响 ^ 和 $
VERBOSE, X    能够使用 REs 的 verbose 状态，使之被组织得更清晰易懂

(?P<name>...)   匹配的命名组，让匹配的东西能以键 name 的方式取得
(?P=name)        引用已匹配的命名组
(?=...)    正向匹配，例如 window (?=2000|xp|vista)
(?<=...) 返向匹配，例如 (?=2000|xp|vista) window, 与 (?=...) 刚好相反
(?!...)     正向不匹配
(?<!...)   返回不匹配
\number 引用已匹配 \1 \2 表示第一个、第二个匹配

例子1：(?P<name>...)

import re
m = re.search('(?P<word>[a-z]+)(?P<num>\d+)', 'ab12')
print repr(m.group())
print repr(m.group('word')), ',', repr(m.group(1))
print repr(m.group('num')), ',', repr(m.group(2))

输出结果

'ab12'
'ab' , 'ab'
'12' , '12'

例子2：(?=...) 与 (?<=...)

import re
m = re.findall('(?<=1)(a|b|c)', 'a1b2c3')
print repr(m)
m = re.findall('(a|b|c)(?=1)', 'a1b2c3')
print repr(m)

输出结果：

['b']
['a']

例子3：(?!...) 与 (?<!...)

import re
m = re.findall('(?<!1)(a|b|c)', 'a1b2c3')
print repr(m)
m = re.findall('(a|b|c)(?!1)', 'a1b2c3')
print repr(m)

输出结果：

['a', 'c']
['b', 'c']

例子（组合）：

import re
m = re.search('(?<=abc)END(?P<word>[a-z]+)(?P<num>\d+)START(?=hello)', 'abcENDde12STARThello')
print repr(m.group())
print repr(m.group('word')), ',', repr(m.group(1))
print repr(m.group('num')), ',', repr(m.group(2))

输出结果：