Python正则表达式
re.match(pattern, string, flags=0)
尝试从字符串起始位置匹配一个模式;如果不是起始位置匹配成功,则 re.match() 返回none.
匹配成功,re.match() 返回一个匹配的对象,否则返回None.
pattern - 匹配的正则表达式
string - 要匹配的字符串
flags - 标志位,控制正则表达式的匹配方式,如,是否区分大小写,多行匹配等.
import re
print(re.match('www', 'www.runoob.com').span()) # 在起始位置匹配
print(re.match('com', 'www.runoob.com')) # 不在起始位置匹配
>(0, 3)
>None
re.search(pattern, string, flags=0)
扫描整个字符串并返回第一个成功的匹配.
匹配成功, re.search()返回一个匹配的对象,否则返回None.
import re
print(re.search('www', 'www.runoob.com').span()) # 在起始位置匹配
print(re.search('com', 'www.runoob.com').span()) # 不在起始位置匹配
>(0, 3)
>(11, 14)
re.sub(pattern, repl, string, count=0, flags=0)
替换字符串中的匹配项.
pattern - 正则中的模式字符串
repl - 替换的字符串,也可为一个函数
string - 要被查找替换的原始字符串
count - 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配
import re
phone = "2004-959-559
# 删除字符串中的 Python注释
num = re.sub(r'#.*$', "", phone)
print "电话号码是: ", num
# 删除非数字(-)的字符串
num = re.sub(r'\D', "", phone)
print "电话号码是 : ", num
re.split 函数
按照指定的 pattern 格式,分割 string 字符串,返回一个分割后的列表。
re.split(pattern, string, maxsplit=0, flags=0)
pattern compile 生成的正则表达式对象,或者自定义也可
string 要匹配的字符串
maxsplit 指定最大分割次数,不指定将全部分割
import re
str = 'say hello world! hello python'
str_nm = 'one1two2three3four4'
pattern = re.compile(r'(?P<space>\s)') # 创建一个匹配空格的正则表达式对象
pattern_nm = re.compile(r'(?P<space>\d+)') # 创建一个匹配空格的正则表达式对象
match = re.split(pattern, str)
match_nm = re.split(pattern_nm, str_nm, maxsplit=1)
print(match)
print(match_nm)
>['say', ' ', 'hello', ' ', 'world!', ' ', 'hello', ' ', 'python']
>['one', '1', 'two2three3four4']
re.escape(pattern)
可以对字符串中所有可能被解释为正则运算符的字符进行转义的应用函数。如果字符串很长且包含很多特殊技字符,而你又不想输入一大堆反斜杠,或者字符串来自于用户(比如通过raw_input函数获取输入的内容),且要用作正则表达式的一部分的时候,可以使用这个函数。
import re
re.escape('www.python.org')
>'www\\.python\\.org'