Jupyter notebook只能打开当前目录下的数据集
CSV
一、需要使用upload把数据集倒导入到当前目录下。
再打开数据集
dataset=pd.read_csv('huizong.csv')
二、运行报错:编码错误
出现这个的时候,意味着编码错误。
这个问题爬网页的时候也会遇到。原因是python的编码与爬下来的网页编码不一样,python读不懂,只能返回乱码。
解决办法:首先搞清楚Python的默认编码
然后用notepad将本地文件打开,转化为utf-8格式,保存后重新上传文件即可
excel
有两种方法
#用pd包中的read_excel方法
datasets2=pd.read_excel('汇总-京东.xlsx')
print(datasets2.head())
结果
#用pd包中的ExcelFile方法
fileNameStr='汇总-京东.xlsx'
xls = pd.ExcelFile(fileNameStr)
salesDf = xls.parse('京东汇总')
salesDf.head(3)
结果