Python内部使用的是unicode编码,而外部却要面对千奇百怪的各种编码,比如作为中国程序经常要面对的gbk,gb2312,utf8等,这些编码需要转换成内部的unicode编码格式后,Python才可以处理;
源代码文件作为文本文件以某种编码形式存储代码的,Python默认会认为文件是ASCI编码,比如说代码中有一个变量赋值:
s1=’a’
print s1
Python认为这个’a'就是一个asci编码的字符。但是如果用了中文,比如:
s1=’哈’
print s1
这个代码文件被执行时编码会出问题。python默认将代码文件内容当作asci编码处理,但asci编码中不存在中文