最近在做计算机网络课的一个课程项目,要在应用层实现可靠数据传输,即传输层用UDP不可靠信道。因为涉及到了字节流的传输,所以不可避免地要用到进制的转换,在查找了各处的资料之后,总结了以下方法。
以下代码都在命令行窗口测试过。
直接转换
使用bin,oct,hex可将其他进制的数分别转换为二进制、八进制、十六进制。
>>> a = 50
>>> bin(a)
'0b110010'
>>> oct(a)
'0o62'
>>> hex(a)
'0x32'
>>> bin(a)[2:]
'110010'
使用int
使用int()可以将任意进制的数转换为十进制。
>>> int('50', 10)
50
>>> int('0b110010', 2)
50
>>> int('0o62', 8)
50
>>> int('0x32', 16)
50
>>> int('110010', 2) # 可以不用有0b前缀
50
>>> int('50', 9) # 任何进制都能转换,比如9
45
使用format
>>> format(a, 'd')
'50'
>>> format(a, 'b')
'110010'
>>> format(a, 'o')
'62'
>>> format(a, 'x')
'32'
>>> "{0:d}".format(50)
'50'
>>> "{0:b}".format(50)
'110010'
>>> "{0:o}".format(50)
'62'
>>> "{0:x}".format(50)
'32'
>>> "{0:08b}".format(50) # 指定宽度为8,不足的在前面补0
'00110010'
关于format有疑问的可参考:Python format 格式化函数
转化为bytes
以上的方法虽然看起来都实现了进制间的转换,但其实都是数字和字符串之间的转换,其内存空间也相应改变了。而要使数据能在网络传播,就把数据转为数据字节流,即bytes。
>>> a = 50
>>> a.bit_length() # 查看数字占用的位长度
6
# a=50,对应二进制为110010,两个字节为‘00000000 00110010’,ascii编码中 50 对应的字符为 2
>>> a.to_bytes(2, byteorder='little') # 转为2字节的bytes, 低位在前面
b'2\x00' # b‘\x00’表示 0x00 即 0b00000000,'2' 是 ascii编码中 50 对应的字符
>>> a.to_bytes(2, byteorder='big') # 转为2字节的bytes, 高位在前面
b'\x002'
>>> b = -50
>>> b.to_bytes(2, byteorder='little',signed=True) # 有符号数
b'\xce\xff'
>>> b'\x002'[1] # 获取第1个字节即 b‘2’
50 # 输出其utf-8编码(这里与ASCII编码相同,因为‘2’可用ASCII编码表示,ASCII编码可看成utf-8编码的一部分)
>>> b'\x002'[0] # 获取第0个字节即 b‘\x00’
0
>>> int.from_bytes(b'\x002', byteorder='big')
50
对bytes有疑问的可参考:字符串和编码