1. 背景
我写了一个RC4加密的程序,如下所示。
data = b"204EF6D2FB3B"
key = b'123'
# 加密(引用传递)
dll.RC4_enc_dec(data,key)
print('加密结果:',data) # b'a\xc0\x8b\xc7\xa3B@\xc9c!0\xc8'
# 解密
dll.RC4_enc_dec(data,key)
print('解密结果:',data) # b"204EF6D2FB3B"
需求:我希望将加密结果作为“注册码”来使用
问题1:这个 \x 格式的字节串太丑了。能不能变成纯16进制字符串的样式?可以
data.hex() # "61c08bc7a34240c9632130c8"
问题2:但是解密时仍需要\x格式的字节串,怎么变回去?
data = bytes.fromhex(data) # b'a\xc0\x8b\xc7\xa3B@\xc9c!0\xc8'
2. 分析
看下面这句话:
在Python中,当你打印 ( print
) 一个字节串(bytes
类型)时
如果其中包含非打印字符(即ASCII表中那些不可见的控制字符或不在打印范围内的字符)
那么它们通常会被显示为\xHH
的形式,其中HH
是字符的十六进制表示。
这里明明说了HH是16进制表示,为什么会有 \xc9c!0 这种奇葩的符号存在呢?
因为print字节串时,可打印的字符,仍会正常打印出来。即\xHH与可打印Ascii码是混合显示的。
应该这样理解:
字节 \xc9 字节 c 字节 ! 字节 0
3. 拓展
字符串含有中文,怎么转为字节串?
"hello世界".encode("utf-8") # b'hello\xe4\xb8\x96\xe7\x95\x8c'
可以看到,hello因为是Ascii字符,在打印字节串时正常显示
'世界' 是非Ascii字符,根据utf-8编码规则,将其转为6个字节 e4 b8 96 e7 95 8c
这6个字节是不可打印字符,故只能添加前缀\x ,提醒我们这是字节 e4 ,不是字符 e4