import re
https://www.cnblogs.com/xiaokuangnvhai/p/11213308.html
1、sub()函数
替换匹配成功的字符串
re.sub(pattern,repel,string,count = 0,flags = 1)
#pattern 正则模型
#repl 要替换的字符串
#string 要匹配的字符串
#count 指定匹配的个数
#flags 匹配模式
2、正则模型:
\w 匹配包括下划线在内的所有字母、汉字、数字字符
\W 匹配所有非字母、汉字、数字的字符
r 原生字符,将python中有转义后字符转成原生字符进行匹配
^ 反取;(re.findall("[^a-z]",str)) #反取,匹配出除字母外的字符,返回值是list
例子:
re.sub(r'[^\w ]', ' ', text) #将字符串text中的所有标点符合和换行符转换成空格