本文主要介绍了三种解决方案:
解决方案一:在需要打印的中文字符前加个u,用于标识所要打印的是一个Unicode字符串。(我感觉着一种方法是最简单和省事的,并且使用其他集成开发工具的若遇到类似的问题,也应该可以使用这种方法解决,具体大家可以在下方评论)(测试此方法不适合在Vistual Stdio Code中使用,可以参考解决方案二)
解决方案二:使用encode与decode方法,把编码从UTF-8转到GBK以在CMD中正常显示。
解决方案三:因为在Python3中,对中文进行了全面的支持,所以我们可以使用Python 3.x的编译器。
问题原因讨论:
笔者使用Visual Stdio 2017——15.7.4、Python 2 64-bit(2.7.14)编译器。(其他版本的VS和Python2.x的解决办法应该都是一样的)
Python2默认采取的ASCII编码,字母、标点和其他字符只使用一个字节来表示。然而我们知道对于中文字符来说,一个字节是满足不了需求的,中文编码是用两个字节来表示的,因而如果我们在python源文件中加入了中文(包括打不仅仅局限于注释部分),则必须使用“#coding=utf-8”或“#-*- coding:utf-8 -*-”来声明编码格式。然而CMD下默认的编码方式为:GBK,这与我们声明的UTF-8是不一样的,因而如果GBK与UTF-8混合使用的话,就会导致解码错误,从而导致乱码。
解决方案一:在需要打印的中文字符前加个u,用于标识所要打印的是一个Unicode字符串。
解决方案二:使用encode与decode方法,把编码从UTF-8转到GBK以在CMD中正常显示。
参考如下代码,其中encode代表编码,decode代表解码。
这种方法每次使用比较麻烦?如果使用比较多的话,我们完全可以写成一个方法嘛。
#coding=utf-8
#定义函数
def t(x):
print x.decode('UTF-8').encode('GBK'),
#测试效果
print '测试一'.decode('UTF-8').encode('GBK')
t('测试二')
运行结果:
以下是我具体使用实例
运行结果:
解决方案三:因为在Python3中,对中文进行了全面的支持,所以我们可以使用Python 3.x的编译器。
在Python3中,不需要来回的编解码,并且字符串对象也没有decode与encode方法。