re.split 函数
re.split(pattern,str,maxsplit=0,flags=0)
参数:
pattern:cpmpile生成的正则表达式对象,或者自定义的也可以
str:要匹配的字符串
maxsplit:最大分割次数,不指定将全部分割
flags参数:
re.I(re.IGNORECASE) 使匹配对大小写不敏感
re.L(re.LOCAL) 做本地化识别(locale-aware)匹配
re.M(re.MULTILINE) 多行匹配,影响 ^ 和 $
re.S(re.DOTALL) 使 . 匹配包括换行在内的所有字符
re.U(re.UNICODE) 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X(re.VERBOSE) 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。
eq:
import re
str = 'say hello world!'
str_nm = 'one1two2three3'
pattern = re.compile(r'\s')
pattern_nm = re.compile(r'\d+')
match = re.split(pattern,str)
match_nm = re.split(pattern_nm,str_nm)
结果:
['say', 'hello', 'world!']
['one', 'two2three3']
re.finditer(pattern,string)函数
finditer返回的是一个可迭代对象,里面的元素也是可迭代对象,要使用group()
findall返回的是一个列表,里面的元素是匹配到的字符串