Python使用内置的re库,由于python和正则表达式都使用/作为转义符,故为避免歧义在表达式前面加r,内部的字符串默认不转义。
re.match( ) 从字符串的起始位置匹配,匹配成功返回一个匹配的对象,否则返回None
re.search( ) 扫描整个字符串并返回第一个成功的匹配
re.findall( ) 在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的则返回空列表
re.split( ) 将一个字符串按照整组人表达式匹配结果进行分割,返回列表类型
re.finditer( ) 在字符串找到正则表达式所匹配的所有子串,并把他们作为一个迭代器返回
re.sub( ) 把字符串中所有匹配正则表达式的地方换成新的字符串
1.re.match( )
re.match(patten,string,flags=0)
'''
pattern: 匹配的正则表达式
string: 要匹配的字符串
flags: 标志位,用于控制正则表达式的匹配方式,flags=0表示不进行特殊指定
'''
修饰符被指定为一个可选的的标志。多个标志可以通过按位OR(|)指定,如re.I|re.M被设置成I和M标志
re.I:使匹配对大小写不敏感
re.L:做本地化识别(locale-aware)匹配
re.M:多行匹配,影响^和$
re.S:使 . 匹配换行在内的所有字符
re.U:根据Unicode字符集解析字符。这个标志影响\w,\W,\b,\B
re.X:该标志通过给与你更灵活的格式以便你将正则表达式写的更易于理解。
2.re.search( )
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配(注意:仅仅是第一个)
3.re.findall( )
4.re.split( )
5.re.finditer( )
6.re.sub( )
re.sub(pattern,repl,string,count=0)
'''
pattern: 正则中的模式字符串
repl: 替换的字符串,也可作为一个函数
string: 要被查找替换的原始字符串
count: 模式匹配后替换的最大次数,默认0表示替换所有的匹配
'''