Mac pandas bug记录(路径及缓存问题-Excel file format cannot be determined,you must specify an engine manually.

最近在做网上爬取财务数据的小项目,调试代码的过程中遇到了一个pandas 运行bug:pandas读取文件需要指定engine的类型。

原因:路径及缓存问题

1.问题:pandas 读写文件报错,

Excel file format cannot be determined,you must specify an engine manually.

见下图:
请添加图片描述

2.主要原因有两个:

2.1.打开excel会有"~$“开头的缓存文件。
2.2.Mac 下的pands运行有”.DS_Store"缓存文件。

如果存在缓存文件或者其他pandas默认读取不了的文件,就会让我们指定pandas的engine了。

3.解决办法:正确确定路径和清除缓存文件

通过if 判断是否有缓存文件,然后通过os.remove()移除,这样后续的pandas读取就不会报bug了。

  for name in path_list:
        if name.endswith('.DS_Store'):
            os.remove(os.path.join(sub_comp , name))

    for name in path_list:
        if name.startswith('~$'):
            os.remove(os.path.join(sub_comp , name))

这样就可以把文件夹中缓存文件删除,后续读取用来做数据分析容易多了。

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值