Python内容匹配的re模块
re
模块是Python
的正则表达式模块,有关正则表达式的更多知识参见下一章节《Python 正则表达式》,下面我们来介绍re
模块的常用函数。
函数re.findall(pattern, string, flags)
从string
中查找所有符合pattern
正则表达式模式的子串,以这些子串作为列表元素返回一个列表。 参数说明:
pattern
:要搜寻的正则表达式;string
:要检索的字符串;flag
:可选项,可设置搜索的要求。可以选择输入re.S
,re.I
等。re.S
:如果不使用re.S
参数,则只在每一行内进行匹配,如果一行没有,就换下一行重新开始,不会跨行。而使用re.S
参数以后,正则表达式会将这个字符串作为一个整体,将\n
当做一个普通的字符加入到这个字符串中,在整体中进行匹配;re.I
:忽略大小写。
下面给出了具体的使用示例:
# coding=utf-8
import re
string = 'o1n27m3k486'
pattern = r'[1-9]+'
print(re.findall(pattern, string))
输出结果: ['1', '27', '3', '486']
函数re.search(pattern,string,flags)
参数与re.findall()
的参数意义相同。re.search
函数会在字符串内查找模式匹配,只要找到第一个匹配然后返回MatchObject
对象,如果字符串没有匹配,则返回None
。 下面给出了具体的使用示例:
# coding=utf-8
import re
string = 'o1n27m3k486'
pattern = r'[1-9]+'
print(re.search(pattern, string).group(0))
输出结果: 1
函数re.compile(pattern,flags=0)
编译正则表达式模式,返回一个对象的模式。(可以把那些常用的正则表达式编译成正则表达式对象,这样可以提高一点效率。) 参数与re.findall()
、re.search()
的参数意义相同。 下面给出了具体的使用示例:
# coding=utf-8
import re
string = 'o1n27m3k486'
pattern = r'[1-9]+'
obj = re.compile(pattern)
print(obj.findall(string))
输出结果: ['1', '27', '3', '486']