python中判断字符串中是否含有中文字符

最新推荐文章于 2022-06-17 09:35:00 发布

空字符（公众号：月来客栈）

最新推荐文章于 2022-06-17 09:35:00 发布

阅读量7.4k

点赞数 1

分类专栏：数据预处理

数据预处理专栏收录该内容

15 篇文章 5 订阅

订阅专栏

转自：http://www.cnblogs.com/changzhi/p/3376140.html

首先，在python中字符串的表示是用unicode编码。所以在做编码转换时，通常要以unicode作为中间编码。

decode的作用是将其他编码的字符串转换成unicode编码，比如a.decode('utf-8')，表示将utf-8编码的字符串转换成unicode编码。encode的作用是将unicode编码的字符串转换成其他编码格式的字符串，比如b.encode('utf-8')，表示将unicode编码格式转换成utf-8编码格式的字符串

#-*- coding:utf-8 -*-

import sys
reload(sys)
sys.setdefaultencoding('utf8')

def check_contain_chinese(check_str):
    for ch in check_str.decode('utf-8'):
        if u'\u4e00' <= ch <= u'\u9fff':
            return True
    return False

if __name__ == "__main__":
    print(check_contain_chinese('中国'))
    print(check_contain_chinese('xxx'))
    print(check_contain_chinese('xx中国'))

结果：
True
False
True