【已解决】Python字符串转字节后怎么变长了？长度翻了一倍，如何保持与原字符串的长度一致？

Scott0902

已于 2022-11-27 01:25:08 修改

阅读量650

点赞数

分类专栏： Python 文章标签： python 开发语言

于 2022-11-27 01:17:21 首次发布

本文链接：https://blog.csdn.net/Scott0902/article/details/128059789

版权

Python 专栏收录该内容

37 篇文章 3 订阅

订阅专栏

最近笔者在用Python对字符串进行简单的异或运算加密时遇到一个问题：字符串转为字节类型后，长度比原先的字符串长了一倍。怎样才能将转换后的字节长度保持与原字符串长度相同？

举个简单的加密例子：

origin = 'I Love PY Coding'
# key是参与异或运算的密钥
key = 100
enc_str = ''
for i in origin:
    # 对原字符串逐个字符异或运算
    enc_str += chr (ord(i) ^ key)
enc_byte = bytes (enc_str, 'utf-8')
print ('原字符串长度：', len(origin))
print ('加密后的字符串：', enc_str)
print (f'转换字节为：{str(enc_byte)}\n长度：{len(enc_byte)}')

运行结果如下图：

看起来没毛病，是吧？

但是，当key值大于等于128、小于等于255时，加密的字节却长了一倍。
比如我随便把key值改为129：

key = 129

运行结果：

为什么此时转了字节后的长度大了一倍？如果要将转换后的结果写入二进制文件，文件尺寸翻倍，这不是我期待的结果。我猜想大概是bytes转换时加了设定 utf-8 编码导致。如果不用 utf-8 编码，改用 gbk 编码如何？结果却报错了，我又把 gbk 编码改为 ansi、ascii，结果同样出错。对于ASCII值在127~255范围内的字符串确实只能用 utf-8 编码才不会报错：

笔者仔细查阅了Python的字符串与字节转换的相关文章再作调试。

若要保持与原字符串长度一致，正确的姿势是先把加密后的各个字符保存为列表，再作bytes转换，需要注意的是，对列表进行转换bytes是不需要指定encoding编码的。代码修正如下：

origin = 'I Love PY Coding'
# key是参与异或运算的密钥
key = 129
enc_str = []
for i in origin:
    # 对原字符串逐个字符异或运算，这次先保存字符ASCII值为列表
    enc_str.append (ord(i) ^ key)
# 然后将列表进行bytes转换
# 注意此时不需要指定encoding了
enc_byte = bytes (enc_str)
print ('原字符串长度：', len(origin))
print ('加密后的字符串：', enc_str)
print (f'转换字节为：{str(enc_byte)}\n长度：{len(enc_byte)}')

Scott0902

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【已解决】Python字符串转字节后怎么变长了？长度翻了一倍，如何保持与原字符串的长度一致？

字符串转为字节类型后，长度比原先的字符串长了一倍，系操作不正确导致。先保存字符串的ASCII值为列表，然后再进行bytes转换才能解决。
复制链接

扫一扫