如果你想格式化字节字符串,你得先使用标准的文本字符串,然后将其编码为字节 字符串。
>>> b'%10s %10d %10.2f' % (b'ACME', 100, 490.1) Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unsupported operand type(s) for %: 'bytes' and 'tuple' >>> b'{} {} {}'.format(b'ACME', 100, 490.1)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'bytes' object has no attribute 'format' >>>
最后需要注意的是,使用字节字符串可能会改变一些操作的语义,特别是那些跟文 件系统有关的操作。比如,如果你使用一个编码为字节的文件名,而不是一个普通的文 本字符串,会禁用文件名的编码/解码。
>>> # Write a UTF-8 filename
>>> with open('jalape\xf1o.txt', 'w') as f:
... f.write('spicy')
...
>>> # Get a directory listing
>>> import os
>>> os.listdir('.') # Text string (names are decoded) ['jalapeño.txt']
>>> os.listdir(b'.') # Byte string (names left as bytes) [b'jalapen\xcc\x83o.txt']
>>>
注意例子中的最后部分给目录名传递一个字节字符串是怎样导致结果中文件名以 未解码字节返回的。在目录中的文件名包含原始的 UTF-8 编码。参考 5.15 小节获取更 多文件名相关的内容。
最后提一点,一些程序员为了提升程序执行的速度会倾向于使用字节字符串而 不是文本字符串。尽管操作字节字符串确实会比文本更加高效 (因为处理文本固有的 Unicode 相关开销)。这样做通常会导致非常杂乱的代码。
你会经常发现字节字符串并不 能和 Python 的其他部分工作的很好,并且你还得手动处理所有的编码/解码操作。坦 白讲,如果你在处理文本的话,就直接在程序中使用普通的文本字符串而不是字节字符 串。