- 中文字符的编码范围 \u4e00 - \u9fa5, 所以找中文的话只需要判断是否在这个区间即可
- 正则匹配找到中文输出
import re
str1 = 'hello,你叫什么名字?My name is 李小龙.'
res1 = re.findall("[\u4e00-\u9fa5]+",str1)
print(res1)
str2 = 'hello,你叫什么名字?My name is 李小龙.'
a = re.compile("[\u4e00-\u9fa5]+")
res2 = a.findall(str2)
print(res2)
- 判断字符串是否包含中文?
def contain_chinese(check_str):
for ch in check_str:
if '\u4e00' <= ch <= '\u9fa5':
return True
return False
print(contain_chinese('你好a'))
print(contain_chinese('hello'))