之前简单介绍过,python有强大的数据处理和分析的能力,能够帮助省去excel很多繁琐的步骤或者省去写宏的烦恼,并且运行速度快的不是一点点。然而,现实工作中,大家手上的数据更多的可能是excel的文件,不用担心,只要一步操作就可以实现读取了。
我画了张简单的流程图例子(pandas怎么处理excel),帮助大家理解。
也许有人会说,如果只是为了排个序,有必要搞这么复杂吗,我自己带开excel,倒腾一下,再关上就行了,为什么要用python。那我把情况复杂化一下,如果是要对100张excel表做同样的操作步骤,你是愿意敲三行代码,坐等几秒钟输出excel呢,还是愿意花一个上午,埋头做100次反复的动作呢。如果下一周又有新的100张表,你是愿意直接点鼠标运行代码呢,还是再花一个上午埋头做100次反复的动作呢。
那么怎么实现 -- 把excel内容倒入python?
第一步:打开anaconda里面的jupyter note或IP[y]直接上手写代码
第二步:import pandas as pd (要了解这什么意思的话,请参考上一篇系统学习第一步 -- 系统学习第一步 -- 不得不掌握的pandas & dataframe)
第三步: 想好自己的excel文件在哪里
第四步:调用pandas.read_excel()这个功能
1. pandas.read_excel ()
()里面第一个内容,输入要读的excel文件的路径,第二个内容输入要读哪张表
2. 通过案例来体会吧
比如,我有这样一张excel表(example.xlsx),里面有2张sheets。
“excel路径”
【苹果系统】
存放在我的Documents下Admin文件夹里面,那么这个excel的路径如下:
'/Users/电脑的用户名/Documents/Admin/example.xlsx'
【Windows系统】
存放在C盘的下User文件夹里面,那么这个excel的路径如下:
'C:/Users/example.xlsx'
“要读哪张表”
首先,用一个代号,指代example.xlse的完整路径,否则每次写都一长串。
情形1,读example.xlsx里面的第一张表
情形2,读example.xlsx里面的第二张表
情形3,读example.xlsx里面的所有表
学会了吗,明天会稍微再拓展介绍下pandas.read_excel的更多其他高级功能。敬请关注。
homework,做一张有5个sheet的表格,读取第1,3,5个sheet。
关于留言,较新的公众号暂时没有被赋予留言功能,如果有问题可以直接给本公众号私信。