我正在从excel电子表格中读取大量数据,其中我使用以下一般结构从电子表格中读取(并重新格式化和重写):book = open_workbook('file.xls')
sheettwo = book.sheet_by_index(1)
out = open('output.file', 'w')
for i in range(sheettwo.nrows):
z = i + 1
toprint = """formatting of the data im writing. important stuff is to the right -> """ + str(sheettwo.cell(z,y).value) + """ more formatting! """ + str(sheettwo.cell(z,x).value.encode('utf-8')) + """ and done"""
out.write(toprint)
out.write("\n")
其中x和y在本例中是任意单元,其中x表示较少的任意性,并且包含utf-8字符
到目前为止,我只在单元格中使用.encode('utf-8'),因为我知道如果不使用utf-8,就会出现错误或预见错误。在
我的问题基本上是这样的:在所有单元上使用.encode('utf-8')是否有缺点,即使它是不必要的?效率不是问题。主要问题是,即使在不该出现的地方有一个utf-8字符,它也能正常工作。如果我只是把“.encode('utf-8')”放在每次读取的单元格上都不会出错,那么我可能会这样做。在