re库是Python自带的库,re库采用raw string(原生字符串)类型表示正则表达式,输入时需表示为r'text',若不添加开头的raw_input标识符,则需要对文本中的"\"进行转义,这会徒增很多不必要的麻烦,所以使用正则表达式时尽量用原生字符串类型来表示。
re库含有许多功能函数,在此先介绍其中最常用的六个,其他的函数在今后的实际问题中再具体解析。
函数 | 说明 |
re.search() | 在一个字符串中搜索匹配正则表达式的第一个位置,返回match对象 |
re.match() | 在一个字符串的开始位置起匹配正则表达式,返回match对象 |
re.findall() | 搜索字符串,以列表类型返回全部能匹配的子串 |
re.split() | 将一个字符串按照正则表达式匹配结果进行分割,返回列表类型 |
re.finditer() | 搜索字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象 |
re.sub() | 在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串 |
下面来解释下各个功能函数的参数:
re.search(pattern, string, flag=0)
pattern: 正则表