python中使用re模块来实现正则表达式的匹配。 re.sub() 函数主要用于替换字符串中的匹配项。
sub函数的源码
re.sub()方法中含有5个参数:
(1)pattern:该参数表示正则中的模式字符串;
(2)repl:该参数表示要替换的字符串(即匹配到pattern后替换为repl),也可以是个函数;
(3)string:该参数表示要被处理(查找替换)的原始字符串;
(4)count:可选参数,表示是要替换的最大次数,而且必须是非负整数,该参数默认为0,即所有的匹配都会被替换;
(5)flags:可选参数,表示编译时用的匹配模式(如忽略大小写、多行模式等),数字形式,默认为0。
举例说明
<DIV>This is the first line <![CDATA[<div>]]></DIV>code=re.sub(r'<!\[CDATA\[.*?\]\]>','-',code) print(code)
<DIV>This is the first line -</DIV>