转自:http://www.cnblogs.com/changzhi/p/3376140.html
首先,在python中字符串的表示是用unicode编码。所以在做编码转换时,通常要以unicode作为中间编码。
decode的作用是将其他编码的字符串转换成unicode编码,比如a.decode('utf-8')
,表示将utf-8编码的字符串转换成unicode编码。encode的作用是将unicode编码的字符串转换成其他编码格式的字符串,比如b.encode('utf-8')
,表示将unicode编码格式转换成utf-8编码格式的字符串
#-*- coding:utf-8 -*-
import sys
reload(sys)
sys.setdefaultencoding('utf8')
def check_contain_chinese(check_str):
for ch in check_str.decode('utf-8'):
if u'\u4e00' <= ch <= u'\u9fff':
return True
return False
if __name__ == "__main__":
print(check_contain_chinese('中国'))
print(check_contain_chinese('xxx'))
print(check_contain_chinese('xx中国'))
结果:
True
False
True