字符编码和解码
字符—》字节 是编码
字节—》字符 是解码
Python2里面的字符串类型是原始的字节串
Python2中编码:从Unicode编码指定格式的字节串(string对象)
Python2中的解码:从字符串(string对象)解码成Unicode对象
Python3中字符串类型的内部表示其实是UTF-8
Python3中的编码:
从Unicode字符串编码指定格式为字节串:bytes对象
‘你好’.encode(‘UTF8’)
Python3中的解码:
从字节串(bytes对象)解码成字符串对象
byteVar=‘你好’.encode(‘UTF8’)
byteVar.decode(‘utf8’)
对文件的处理
Python3解释器缺省使用utf-8码来解码文件
Python2解释器缺省使用ASCII码来解码文件
告诉解释器,这个代码文件的编码方式
#coding=utf-8 等号前后不要有空格
print(’‘abc’’)
在代码第一行或者第二行显示加上注释#coding=utf-8 指明代码文件的编码方式
如果是其他编码方式,比如gbk等,必须正确的指明:#coding=gbk 也可以用#coding:gbk
如果文件是以二进制打开,在写入的时候,要指定编码格式
如果文件是以UTF8打开,在写入的时候,不需要指定编码格式,会自动按照打开的方式写入。