python中的编码
说不清的几个概念
码: 字符集, 如ascii码和unicode码
编码: encode, 把人类语言编译成二进制数据
解码: decode, 把二进制数据解释成人类语言
编码方式: 编辑字符集(码)的方式或规则
python2
py2中输出的数据都是字符串类型: 又分为str字符串和unicode字符串.str默认是ascii码, 又升级了utf-8和gbk两种编码方式.
python3
py3中输出的数据分为bytes类型和str类型∶bytes使用ascii码,str使用unicode码. str默认的编码方式是utf-8, 还有utf-16, utf-32
统一中文的编码方式
字符串通过encode(“gbk”)或者encode()内置方法可以编码成二进制的数据类型.再通过decode(“utf-8”)解码成互联网通用的utf-8编码方式的人类语言.