python数据结构算法题四十二:编码/解码操作

本文讲述了在Python中如何处理字节字符串,包括格式化操作的限制,以及在涉及到文件系统时字节字符串可能导致的问题,建议在处理文本时优先使用文本字符串以避免编码/解码的复杂性。
摘要由CSDN通过智能技术生成

如果你想格式化字节字符串,你得先使用标准的文本字符串,然后将其编码为字节 字符串。

>>> b'%10s %10d %10.2f' % (b'ACME', 100, 490.1) Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unsupported operand type(s) for %: 'bytes' and 'tuple' >>> b'{} {} {}'.format(b'ACME', 100, 490.1)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'bytes' object has no attribute 'format' >>>

最后需要注意的是,使用字节字符串可能会改变一些操作的语义,特别是那些跟文 件系统有关的操作。比如,如果你使用一个编码为字节的文件名,而不是一个普通的文 本字符串,会禁用文件名的编码/解码。

>>> # Write a UTF-8 filename
>>> with open('jalape\xf1o.txt', 'w') as f:
... f.write('spicy')
...
>>> # Get a directory listing
>>> import os
>>> os.listdir('.') # Text string (names are decoded) ['jalapeño.txt']
>>> os.listdir(b'.') # Byte string (names left as bytes) [b'jalapen\xcc\x83o.txt']
>>>

注意例子中的最后部分给目录名传递一个字节字符串是怎样导致结果中文件名以 未解码字节返回的。在目录中的文件名包含原始的 UTF-8 编码。参考 5.15 小节获取更 多文件名相关的内容。

最后提一点,一些程序员为了提升程序执行的速度会倾向于使用字节字符串而 不是文本字符串。尽管操作字节字符串确实会比文本更加高效 (因为处理文本固有的 Unicode 相关开销)。这样做通常会导致非常杂乱的代码。

你会经常发现字节字符串并不 能和 Python 的其他部分工作的很好,并且你还得手动处理所有的编码/解码操作。坦 白讲,如果你在处理文本的话,就直接在程序中使用普通的文本字符串而不是字节字符 串。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值