python2中需声明
#-*- coding: GBK -*-
或 #Coding:GBK
python3中已不需要声明
python2中
当python解释器执行到产生字符串的代码时(例如s='中国'),会申请新的内存地址,然后将'中国'编码成文件开头指定的编码格式,这已经是encode之后的结果了,所以s只能decode。再次encode就会报错。
当程序执行时,比如:创建变量#这一步是将x指向的那块新的内存空间(非代码所在的内存空间)中的内存,打印到终端,而终端仍然是运行于内存中的,所以这打印可以理解为从内存打印到内存,即内存->内存,unicode->unicode.对于unicode格式的数据来说,无论怎么打印,都不会乱码.python3中的字符串与python2中的u'字符串',都是unicode,所以无论如何打印都不会乱码.在windows终端(终端编码为gbk,文件编码为utf-8,乱码产生)