在进行数据预处理的时候,我们可能习惯于将用于存储数据的其他格式的文件转换为.txt文件,因为这类文件读取、写入和处理起来都比较高效。这篇博客主要介绍一种快速地将excel文件转化为.txt文件的方法,希望对大家有帮助。
我们可以使用xlrd模块读出excel文件中的数据,然后再使用传统的write()方法或使用numpy.savetxt()方法将其写入到.txt文件中,但是使用pandas模块来处理这个任务会更快。
原始数据截图如下:
具体代码和效果如下:
import pandas as pd
df = pd.read_excel('file1.xlsx', sheetname='Sheet1', header=None) # 使用pandas模块读取数据
print('开始写入txt文件...')
df.to_csv('file2.txt', header=None, sep=',', index=False) # 写入,逗号分隔
print('文件写入成功!')
写入前:
写入后: