字符、字符串、编码
str类型和bytes类型
bytes: 二进制
互联网上数据都是以二进制的方式传输的
str: unicode的呈现形式
Unicode、UTF-8、ASCII的相关知识
字符(Character)是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等
字符集(Character set)是多个字符的集合
字符集包括:ASCII字符集、GB2312字符集、GB18030字符集、Unicode字符集等
ASCII编码是1个字节,而Unicode编码通常是2个字节
UTF-8是Unicode的实现方式之一,UTF-8是它的一种变长的编码方式,可以是1、2、3个字节
str与bytes的转换
字符串数据使用encode方法转换为bytes
Bytes类型数据通过decode转换为字符串类型数据
response.encoding = ‘utf8’, 手动指定编码方式
编码方式默认是utf-8,如果需要选定编码方式,编码方式解码方式必须一致,否则就会出现乱码