通过对文本进行编码来判断原文本是否为乱码,像一些颜文字也会被识别未乱码
def check_is_encode_error(string):
try:
string.encode('gbk')
except UnicodeEncodeError:
return True
return False
def main():
# 正常字符返回False
a = '北极1a*&&&/、?%F$^_^、'
r = check_is_encode_error(a)
print(r)
# 乱码字符返回True
b = '家BBQï'
r = check_is_encode_error(b)
print(r)
if __name__ == "__main__":
main()
感谢原博主的分享:这里