python2.x版本:
python内部使用unicode
源代码文件默认是asci,但asci不存在中文编码,解决:# -*- coding: utf-8 -*-
中文编码有:gbk,gb2312,gb18030,utf-8
unicode类和str类型字符串(gbk,gb2312,utf-8)的编码:unicode由encode方法编码为字符串,字符串由decode方法解析为unicode对象
s=u'中文'表示unicode对象
s='中文'表示默认编码,如在utf-8文件中,则为utf-8编码
unicode字符转换为str类型:u'中文'.encode("utf-8")或unicode('中文').encode("utf-8")
unicode经过encode为utf-8等,再经过decode为unicode
python3.x版本:
不支持u'中文'
str(表示中文)经过encode为bytes,再经过decode为str