关于python的字节串与字符串的转换

最新推荐文章于 2024-11-02 16:28:26 发布

atregret

最新推荐文章于 2024-11-02 16:28:26 发布

阅读量268

点赞数 10

分类专栏： python 文章标签： python linux 前端

本文链接：https://blog.csdn.net/atregret/article/details/139656195

版权

python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

1. 背景

我写了一个RC4加密的程序，如下所示。

data = b"204EF6D2FB3B"
key =  b'123'

# 加密（引用传递）
dll.RC4_enc_dec(data,key)
print('加密结果：',data) # b'a\xc0\x8b\xc7\xa3B@\xc9c!0\xc8'


# 解密
dll.RC4_enc_dec(data,key)
print('解密结果：',data) # b"204EF6D2FB3B"

需求：我希望将加密结果作为“注册码”来使用

问题1：这个 \x 格式的字节串太丑了。能不能变成纯16进制字符串的样式？可以

data.hex() # "61c08bc7a34240c9632130c8"

问题2：但是解密时仍需要\x格式的字节串，怎么变回去？

data = bytes.fromhex(data) # b'a\xc0\x8b\xc7\xa3B@\xc9c!0\xc8'

2. 分析

看下面这句话：

在Python中，当你打印 ( print ) 一个字节串（bytes 类型）时

如果其中包含非打印字符（即ASCII表中那些不可见的控制字符或不在打印范围内的字符）

那么它们通常会被显示为\xHH的形式，其中HH是字符的十六进制表示。

这里明明说了HH是16进制表示，为什么会有 \xc9c!0 这种奇葩的符号存在呢？

因为print字节串时，可打印的字符，仍会正常打印出来。即\xHH与可打印Ascii码是混合显示的。

应该这样理解：

字节 \xc9 字节 c 字节 ! 字节 0

3. 拓展

字符串含有中文，怎么转为字节串？

"hello世界".encode("utf-8") # b'hello\xe4\xb8\x96\xe7\x95\x8c'

可以看到，hello因为是Ascii字符，在打印字节串时正常显示

'世界' 是非Ascii字符，根据utf-8编码规则，将其转为6个字节 e4 b8 96 e7 95 8c

这6个字节是不可打印字符，故只能添加前缀\x ，提醒我们这是字节 e4 ，不是字符 e4

atregret

关注

10
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录