导入csv文件时encoding和engine的指定

这篇博客探讨了在Python中导入CSV文件时如何指定正确的`encoding`和`engine`。当文件编码为UTF-8或GBK时,需要根据实际格式设置`encoding`参数。若文件名或路径包含中文,应将`engine`从默认的C改为Python,同时配合合适的编码。对于CSV UTF-8(逗号分隔)文件,使用`encoding='utf-8-sig'`,而对于CSV(逗号分隔)文件,则使用`encoding='gbk'`。
摘要由CSDN通过智能技术生成

指定编码格式
Python用得比较多的两种编码格式是UTF-8和gbk,默认编码格式是UTF-8。我们要根据导入文件本身的编码格式进行设置,通过设置参数encoding来设置导入的编码格式。有的时候两个文件看起来一样,它们的文件名一样,格式也一样,但如果它们的编码格式不一样,也是不一样的文件,比如当你把一个Excel文件另存为时会出现两个选项,虽然都是.csv文件,但是这两种格式代表两种不同的文件,如下图所示:

 

如果是CSV UTF-8(逗号分隔)(*.csv)格式的文件,那么导入时就需要加encoding参数。

你也可以不加encoding参数,因为Python默认的编码格式就是UTF-8。

如果是CSV(逗号分隔) (*.csv)格式的文件,那么在导入的时候就需要把编码格式更改为gbk,如果使用UTF-8就会报错。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值