正则表达式——编译标志

最新推荐文章于 2023-07-30 13:59:05 发布

alphabeta12345

最新推荐文章于 2023-07-30 13:59:05 发布

阅读量1.2k

点赞数

分类专栏： python 文章标签：正则表达式编译

本文链接：https://blog.csdn.net/u011402596/article/details/49402703

版权

python 专栏收录该内容

28 篇文章 1 订阅

订阅专栏

re.S

.代表匹配任意单个字符，但是一般情况下\n \t字符却匹配不到。匹配时候加上re.S编译标志即可解决问题。

>>> import re
>>> r1 = r"qq.com" #这里的‘.‘不止是点,代表匹配任意单个字符
>>> re.findall(r1, "qq.com")
['qq.com']
>>> re.findall(r1, "qqxcom")
['qqxcom']
>>> re.findall(r1, "qqxcom", re.S)
['qqxcom']
>>> re.findall(r1, "qq\ncom") #但是在匹配\n \t等却不行，加上re.S编译标志即可
[]
>>> re.findall(r1, "qq\ncom", re.S)
['qq\ncom']
>>> re.findall(r1, "qq\ncom")
[]
>>> re.findall(r1, "qq\tcom", re.S)
['qq\tcom']

re.I

re.IGNORECASE的缩写，此编译标志代表，匹配时候忽视字母大小写

>>> import re
>>> r1 = r"top"
>>> re.findall(r1, "top Top TOP")
['top']
>>> re.findall(r1, "top Top TOP", re.I)
['top', 'Top', 'TOP']

re.M

re.MULTILINE的缩写：多行匹配，影响 ^ 和 $

#!/usr/bin/python
#coding:utf8

import re
r1 = r"^hello|good$"
s = """
hello world
hello python
very good
"""

#在一个字符串有多行的时候
print re.findall(r1, s) #不加re.M之匹配第一行
print "#"*20
print re.findall(r1, s, re.M) #加了之后，匹配所与的行

$ python e6.py 
['good'] 
####################
['hello', 'hello', 'good']

re.X

re.VERBOSE的简写，能够使用REs的verbose状态，使之正则表达式更加清晰。

#!/usr/bin/python
#coding:utf8
import re

#匹配一个电话号码:0570-1234567
res = r"""
\d{3,4}
-?
\d{6,7} 
"""
#res = r"\d{3,4}-?{6,7}" 如果这样的话，匹配不需要加re.X
print re.findall(res, "0570-1234567")
print "#"*20
print re.findall(res, "0570-1234567", re.X)

$ python e7.py 
[] 
####################
['0570-1234567']