Python 入门之编码
1、编码初识:
(1)ASCII码 :256 个 英文1个字节,不支持中文
(2)GBK(国标) : 英文1个字节 中文两个字节
(3)unicode (万国码):英文4个字节 中文4个字节
(4)Utf-8 :最流行的编码集(密码本) 英文1个字节;欧洲2个字节;亚洲3个字节
Win – 编码gbk linux – 编码utf-8 mac – 编码utf-8
2、编码进阶:
(1)编码:
<1> ASCII码:
支持:英文,数字,符号 1字节
不支持:中文
<2> GBK(国标):
支持:英文,数字,符号 --- ASCII 1字节
支持:中文 2字节
<3> Unicode(万国码):
支持:英文,数字,符号 ---ASSCII 4字节
支持:欧洲 4字节
支持:亚洲 4字节
<4> Utf – 8:
支持:英文,数字,符号 ---ASSCII 1字节
支持:欧洲 2字节
支持:亚洲 3字节
1字节 == 8位 (10101001)
字节:存储和传输
<5>字节名.encode(“utf-8”) #编码
s = "今天" # b'\xe4\xbb\x8a\xe5\xa4\xa9'
s1 = s.encode("utf-8") # 编码
print(s1)
<6>字节名.decode(“utf-8”) #解码
s = "今天" # b'\xe4\xbb\x8a\xe5\xa4\xa9'
s1 = s.encode("utf-8") # 编码
s2 = s1.decode("utf-8") # 解码
print(s2)
用什么编码就要用什么解码
网络传输一定是字节
Python3:默认编码unicode
Python2:默认编码ASCII Python不支持中文
3、单位转换:
1字节 == 8位 ( 1Bytes == 8bit )