re.sub()用法
re.sub(pattern, repl, string, count=0, flags=0)
- pattern:被替换的部分–正则表示内的字符串
反斜杠加数字(\N),则对应着匹配的组(matched group) - repl:替换成什么
\n:会被处理为对应的换行符
\r:会被处理为回车符
\g,对应着命了名的组,named group - string:被替换的完整字符
- count:(可选参数)模式匹配后替换的最大次数,默认0表示替换所有的匹配
- flags:可选参数,表示编译时用的匹配模式(如忽略大小写、多行模式等),数字形式,默认为0。
实例:
#单个匹配
re.sub(r'[0-9]','*',s) 将每一个数字替换为一个星号
re.sub(r'[A-Za-z]', '*', s) 每一个字母替换为一个星号 。
re.sub(r'[0-9A-Za-z]', '*', s)
#多个匹配 +
re.sub(r'[0-9]+', '*', s)匹配多个连续的数字,并将多个连续的数字替换为一个星号
re.sub(r'[A-Za-z]+', '*', s) 多个连续的字母替换为一个星号
#匹配非字母 ^
re.sub(r'[^a-z]', '*', s)将单个非小写字母替换为一个星号
re.sub(r'[^A-Za-z]+', '*', s)将多个连续的非字母替换为一个星号
re.sub(r'[^0-9A-Za-z]+', '*', s)将多个连续的非数字和非字母替换为一个星号
re.sub(r'[^a-z ]', '', s) 只保留字母和空格
re.sub(r'[0-9A-Za-z]+?', '', s)去除以?结尾的单词和数字
re.sub(r'http[:.]+\S+', '', s) 去除原始字符串的url