关于python的字节串与字符串的转换

1. 背景

我写了一个RC4加密的程序,如下所示。

data = b"204EF6D2FB3B"
key =  b'123'

# 加密(引用传递)
dll.RC4_enc_dec(data,key)
print('加密结果:',data) # b'a\xc0\x8b\xc7\xa3B@\xc9c!0\xc8'


# 解密
dll.RC4_enc_dec(data,key)
print('解密结果:',data) # b"204EF6D2FB3B"

需求:我希望将加密结果作为“注册码”来使用

问题1:这个 \x 格式的字节串太丑了。能不能变成纯16进制字符串的样式?可以

data.hex() # "61c08bc7a34240c9632130c8"

问题2:但是解密时仍需要\x格式的字节串,怎么变回去?

data = bytes.fromhex(data) # b'a\xc0\x8b\xc7\xa3B@\xc9c!0\xc8'

2. 分析

看下面这句话:

在Python中,当你打印 ( print ) 一个字节串(bytes 类型)时

如果其中包含非打印字符(即ASCII表中那些不可见的控制字符或不在打印范围内的字符)

那么它们通常会被显示为\xHH的形式,其中HH是字符的十六进制表示。

这里明明说了HH是16进制表示,为什么会有 \xc9c!0 这种奇葩的符号存在呢?

因为print字节串时,可打印的字符,仍会正常打印出来。即\xHH与可打印Ascii码是混合显示的。

应该这样理解:

字节 \xc9      字节 c      字节 !       字节 0

3. 拓展

字符串含有中文,怎么转为字节串?

"hello世界".encode("utf-8") # b'hello\xe4\xb8\x96\xe7\x95\x8c'

可以看到,hello因为是Ascii字符,在打印字节串时正常显示

'世界' 是非Ascii字符,根据utf-8编码规则,将其转为6个字节 e4 b8 96 e7 95 8c

这6个字节是不可打印字符,故只能添加前缀\x ,提醒我们这是字节 e4 ,不是字符 e4

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值