「python」python 读取文件常见的问题(macOS)

但这会遇到两个问题:文件路径和编码

 

1.文件路径 -- 路径不正确

mac不存在地址栏,有时候你去获取文件路径粘贴过来打开会报错

File b'***.csv' does not exist

而你不想每次要去找数据文件路径,最简单的办法是先获取你在编辑的Ipython notebook的路径,然后把数据文件放在该路径下,到时候直接输入文件名就能打开文件了。

#获取默认路径
import os
print (os.path.abspath('.'))

比如我的路径是

/Users/apple/Downloads

接下来把数据文件比如rawdata.csv拖到data文件夹下,再打开

data_file = pd.read_csv('rawdata.csv')

就行了,不用输入路径。

 

2.编码问题

当提示

'utf-8' codec can't decode byte 0xd0 in position 0: invalid continuation byte

的时候,意味着编码错误。

这个问题爬网页的时候也会遇到。原因是python的编码与爬下来的网页编码不一样,python读不懂,只能返回乱码。

解决办法是:

首先搞清楚python的默认编码

#获取系统默认编码:
import sys
print(sys.getdefaultencoding())

返回

utf-8

OK如果你爬取的网页的编码是utf-8,爬下来的结果就能正常显示。但把爬下来的数据存到csv文档,让python再次读取又是另一回事,因为csv文档用的未必是utf-8编码,这时候需要解码

import pandas as pd
import numpy as np
data_file=pd.read_csv('rawdata.csv',encoding='gb2312')
print (data_file[0:3])

encoding后面的内容,取决于csv文件的编码。

完事。

 

参考:https://zhuanlan.zhihu.com/p/39184204

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值