前言
工作过程中,因为文字匹配总遇到空格、标点符号、换行等各种符号,需要删除,不然极大的影响了文字比较工作,利用re提取出来,方便快捷,而且简单。
一、代码如下
import re
def chuli(old_s): # 保留中文、大小写、数字
cop = re.compile("[^\u4e00-\u9fa5^a-z^A-Z^0-9]") # 匹配不是中文、大小写、数字的其他字符
nwe_s = cop.sub('', old_s) # 将old_s中匹配到的字符替换成空s字符
return nwe_s
print(chuli("jksj今天。。。..54213./)(*"))
二、输出结果如下
jksj今天54213