目前python的源码文件只有3.X是默认使用utf-8编码的,所以可以正常解析中文,无需指定UTF-8编码。但是其他的版本的默认编码都是ASCII格式,在没有修改格式的时候无法正确答应汉字,所以在读取中文的时候会报错。
解决办法是只要在文件的开头加入# -*-coding:UTF-9 -*-或者#coding=utf-8就可以了。如下:
#!/usr/bin/python
# -*- coding:UTF-8 -*-
print "你好,世界"
如果使用的是编辑器,同时需要设置py文件存储格式为utf-8,否则会出现类似以下的错误:
SyntaxError:(unicode error)`utf-8` codec can't decode byte 0xc4 in position 0:
invalid continuation byte
因为我使用的是pycharm,所以在右下角切换编码就可以。