import re
s = "hello 1234 world xx 大菠萝 456 大烧鸡"
r = re.sub('[a-zA-Z0-9]', '', s) #sub是查找替换,找到英文和数字[a-zA-Z0-9],替换成空字符,替换后首位会有空格
print(r)
print(r.strip()) #去掉首尾空格用 python 里面的 strip() 方法
r = re.findall(r'[\u4e00-\u9fa5]+', s) #如果是正则提取字符串中的中文,可以匹配中文[\u4e00-\u9fa5]
print(" ".join(r))
r = re.sub('[\u4e00-\u9fa5]', '', s) #查找替换中文
print(r)
运行结果:
大菠萝 大烧鸡
大菠萝 大烧鸡
大菠萝 大烧鸡
hello 1234 world xx 456