匹配中文标点符号: [\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b]
匹配中文字符: [\u4e00-\u9fa5]
匹配数字和英文字符:[a-zA-Z0-9]
pattern = re.compile(“[\u3002\uff1b\uff0c\uff1a\u201c\u201d\uff08\uff09\u3001\uff1f\u300a\u300b\u4e00-\u9fa5a-zA-Z^0-9]”) # 匹配不是中文、英文大小写、数字的其他字符
cleaned_str = pattern.sub(“”, str) # 将str中匹配到的字符替换成空s字符