import re
re.sub('[^\u4e00-\u9fa5]+', '', '5.8 abc啊啊啊')
re.sub(pattern, repl, string, count=0, flags=0)
pattern : 正则中的模式字符串。
repl : 替换的字符串,也可为一个函数。
string : 要被查找替换的原始字符串。
count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
“\u4e00”和“\u9fa5”是unicode编码,并且正好是中文编码的开始和结束的两个值,[^…]表示不在[]中的字符,所以这句代码的含义是将非中文字符替换成空格。