1.背景介绍
当我们收到一份中文字符乱码的数据时,该怎么去识别这些乱码的字符?通过肉眼去查看的话,小批量数据的话倒是可行,如果数据量上万或者上亿,那该如何去进行鉴别?
2.实现方法
def check_is_encode_error(string):
try:
string.encode('gbk')
except UnicodeEncodeError:
return True
return False
进行验证
#正常字符返回False
a='北极'
check_is_encode_error(a)
#乱码字符返回True
b='Զ'
check_is_encode_error(b)
3.后记
以上就是对乱码中文字符查找的方法,或许还有更好的方法,欢迎评论区留言或者私信我。