使用Python进行txt文件逐行读取时,对编码是有特殊要求的。一般进行逐行读取的语句为
filepath = 'D:/filename.txt' f = open(filepath,'r') lines = f.readlines() for line in lines: print line
但是有时候我们会发现以下情况,我们在控制台中输出的内容为空。此外,千辛万苦将txt里面的内容一列列整理到一个Dataframe里面,想要保存到csv文件或者xls文件时,发现导出的文件内容都是空的,只有列名。原因是,我们想要读取的txt文件的编码是unicode和ascii格式的,在使用Python进行文本读取时,首先必须先转换为utf-8或者gbk格式,Pandas 不支持读写unicode和ascii编码方式的文件和数据。具体查看txt文件的编码方式的方法:
方法一:打开txt文件,点击左上角的“文件”,点击“另存为”,查看下方的编码方式。