解决ValueError: Excel file format cannot be determined, you must specify an engine manually.

文章讲述了作者尝试使用Python的pandas库读取.xls格式的Excel数据时遇到的问题,包括ValueError和zipfile.BadZipFile错误。最终发现pandas.read_excel仅支持.xlsx格式,而.xls格式数据需要手动转换或使用其他方式处理,因为可能涉及到证券软件的保密限制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

尝试使用python读取excel数据表中的数据,数据表是.xls格式。

第一次尝试

出现报错信息

ValueError: Excel file format cannot be determined, you must specify an engine manually.

第二次尝试

增加了openpyxl引擎

rd0 = pd.read_excel(ip) #raw data 0
#将上面的修改为下面的
rd0 = pd.read_excel(ip, engine = 'openpyxl') #raw data 0

出现报错信息

zipfile.BadZipFile: File is not a zip file

第三次尝试

将文件内容手动复制到新的表中,且新表格式为.xlsx
成功读取

总结

使用openpyxl引擎或者不使用都可以
pandas.read_excel只能读取.xlsx文件,无法读取xls格式的文件
从证券软件下载的数据可能有保密,即使手动将文件名修改为.xlsx也无法读取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值