一、原因
使用pandas中to_excel()函数将dataframe数据写入的时候,有时候会报出“MemoryError”错误。
如下代码:
import pandas as pd
import numpy as np
# 生成dataframe数据并写入Excel表中
df = pd.DataFrame(np.arange(12000000).reshape(300000,40))
# print(df)
df.to_excel('test.xlsx',index=False)
运行结果如下:
因写入的数据量太大,导致报出“内存溢出”的错误。
二、解决方法
使用xlsxwriter模块将数据写入,代码更改为:
import pandas as pd
import numpy as np
import xlsxwriter
# 生成dataframe数据
df = pd.DataFrame(np.arange(12000000).reshape(300000,40))
# print(df)
writer = pd.ExcelWriter('test.xlsx', engine='xlsxwriter', options={'strings_to_urls':False}) # options参数可带可不带,根据实际情况
df.to_excel(writer, index=False)
writer.save()
更改后就不会报错了,xlsxwriter模块是一个python处理Excel写入的专有模块,不支持对Excel的读取,只支持写入,功能非常强大。