进制
进制转换
进制之间转换,二进制、八进制、十六进制可以直接转换成十进制
二进制、八进制、十六进制之间转换需要先转换成十进制在转换成其它进制
v1 = bin(25) # bin 十进制转换为二进制
print(v1) # "0b11001"
v2 = oct(23) # oct 十进制转换为八进制
print(v2) # "0o27"
v3 = hex(28) # hex 十进制转换为十六进制
print(v3) # "0x1c"
# 前2位0b(二进制)、0o(八进制)、0x(十六进制),是几进制base=几
i1 = int("0b11001",base=2) # 25
i2 = int("0o27",base=8) # 23
i3 = int("0x1c",base=16) # 28
编码
ascii编码:
ascii规定使用1个字节来表示字母与二进制的对应关系 。2**8 = 256
gb-2312编码:
与二进制做对应关系时,由如下逻辑 :
单字节表示,用一个字节表示对应关系 。2**8 = 256
双字节表示,用两个字节表示对应关系。2**16 = 65536中可能性
unicode编码:
unicode也被称为万国码,为全球的每个文字都分配了一个码位(二进制表示)
ucs2 :用固定的2个字节去表示一个文字。2**16 = 65535
ucs4 :用固定的4个字节去表示一个文字。2**32 = 4294967296
unicode的应用:在文件存储和网络传输时,不会直接使用unicode,而在内存中会unicode
utf-8编码:
包含所有文字和二进制的对应关系,全球应用最为广泛的一种编码 ,本质上:utf-8是对unicode的压缩,用尽量少的二进制去与文字进行对应。 他可以表示所有的字符且存储或网络传输也不会浪费资源(对码位进行压缩了)
计算机中常见单位b/B/KB/M/G的关系
汉字,用gbk编码需要用2个字节;用utf-8编码需要用3个字节