一般情况下,都是用pandas读取csv文件。但有时候不得不直接读取excel文件。所以想知道.read_csv()
,.read_excel()
哪个性能好?哪个更快?哪个更省时间?
答主griffinc(的结果&数据粘贴如下·英文)
“CSV文件和TXT文件是等同的,无论是读取还是写入。另一个相同点是读写速度比EXCEL快,快得多。当然xlsx格式的文件小。”
测试如下:
文件 | 电脑配置 | Python | Pandas |
---|---|---|---|
320MB foo.csv,16MB foo.xlsx | i7 - 7700k, SSD | Anacond Python 3.5.3 | Pandas 0.19.2 |
用时 | |
---|---|
读取df = pd.read_csv('foo.csv') | 2 秒 |
读取df = pd.read_excel('foo.xlsx) | 15.3秒 |
写入 df.to_csv('hehe.csv', index=False) | 10.5 秒 |
写入 df.to_excel('hehe.xlsx', sheet_name='sheet1', index='False') | 34.5 秒 |