import re
str='''
汉字文字
1234567890
abcdefghijklmnopqrstuvwxyz
-_+=!@#$%^&*()[]{};:"'<>,.?/|~ `
'''
ret = re.findall('[\u4e00-\u9fa5]',str)
# 匹配中文字符(双字节字符),汉字、中文标点符号
# ret = re.findall('[^\x00-\xff]',str)
print(ret)
print(''.join(ret))
输出结果:
小结:
匹配汉字文字:
[\u4e00-\u9fa5]
匹配非汉字字符:
[^\u4e00-\u9fa5]
匹配双字节字符(汉字、中文标点符号等):
[^\x00-\xff]