我必须将文本文件读入
Python.文件编码为:
file -bi test.csv
text/plain; charset=us-ascii
这是一个第三方文件,我每天都会收到一个新的文件,所以我宁愿不改变它.该文件具有非ASCII字符,例如Ö.我需要使用python来读取行,我可以忽略一个非ASCII字符的行.
我的问题是,当我在Python中读取该文件时,当到达非ASCII字符存在的行时,我得到UnicodeDecodeError,并且我无法读取该文件的其余部分.
有没有办法避免这种情况.如果我尝试这样:
fileHandle = codecs.open("test.csv", encoding='utf-8');
try:
for line in companiesFile:
print(line, end="");
except UnicodeDecodeError:
pass;
那么当达到错误时,for循环结束,我无法读取剩余的文件.我想跳过导致错误的行,然后继续.如果可能,我宁愿不对输入文件进行任何更改.
有没有办法做到这一点?
非常感谢你.