我们(最终)将应用程序升级到Python 3。
我们必须升级的一件事是使用普通换行重写CSV文件。
原始(python 2)代码如下所示:import csv
IN_PATH = 'in.csv'
OUT_PATH = 'out.csv'
# Opens the original file in 'text mode' (which has no effect on Python 2)
# and with 'universal newlines',
# meaning \r, \n, and \r\n all get treated as line separators.
with open(IN_PATH, 'rU') as in_csv:
with open(OUT_PATH, 'w') as out_csv:
csv_reader = csv.reader(in_csv)
csv_writer = csv.writer(out_csv)
for tupl in csv_reader:
csv_writer.writerow(tupl)
这些CSV文件是用户提供的。这意味着:我们无法控制他们使用的换行符,所以我们需要处理所有这些。
我们不知道该过程中此阶段的文件编码。
因为我们不知道编码,所以我们无法将字节串解码为文本。
为了在Python 3上完成这项工作,首先我们将其更改为使用io.open(),它主要与py3兼容open()。现在我们不能再使用“文本模式”,因为在Python 3上需要解码字节串,而我们不知道编码。
但是,使用“二进制模式”意味着我们不能再使用通用换行符,因为它只能在文本模式下使用。# Opens the original file in 'binary mode'
# (because we don't know the encoding, so we can't decode it)
# FIXME: How to get universal newline support?
with io.open(IN_PATH, 'rb') as in_csv:
with io.open(OUT_PATH, 'wb') as out_csv:
请注意,虽然Upython 3中不再支持模式字符,但默认情况下它在文本模式下使用通用换行符。它似乎没有任何方式在二进制模式下使用通用换行符。
我们怎样才能使这个代码在Python 3中运行?