如何用Python操作Excel自动化办公?一个案例教会你openpyxl——读取数据

数据分析工作最难搞的是处理数据的过程,不然不会有专门的ETL(数据抽取、转换、加载)工程师了。如果是企业级数据处理可能数据库直接搞定。不过对于日常办公人士来说就会有点麻烦,常常需要处理各种CSV/Excel表格。如果数据量比较小、一次性事务处理的话,手动处理Excel表格就好,用程序或软件的话反而比较麻烦。但是如果数据
摘要由CSDN通过智能技术生成


欢迎大家关注我,我是拾陆,关注同名“二八Data”
数据分析工作最难搞的是处理数据的过程,不然不会有专门的ETL(数据抽取、转换、加载)工程师了。如果是企业级数据处理可能数据库直接搞定。不过对于日常办公人士来说就会有点麻烦,常常需要处理各种CSV/Excel表格。

如果数据量比较小、一次性事务处理的话,手动处理Excel表格就好,用程序或软件的话反而比较麻烦。但是如果数据量比较大、涉及多表操作、数据经常刷新、任务具有重复性,该怎么办呢?还手动吗,手会断掉吧?这个时候就需要借助自动化处理工具来帮忙高效解决问题。

通常自动化办公工具有哪些呢?第一种是Excel插件自动化,就是VBA,VBA可以封装函数和过程,加载之后可以重复调用,但是VBA比较难学,也常常会出现问题,我用过之后就放弃了;第二种是编程语言自动化,比如openpyxl、xlwings、pandas等Python第三方库操作Excel自动化增删改,相对来说比较好学点,DIY程度比较高,操作灵活,其实也是Python的强大之处,Python解决万物,不像VBA你苦心巴力学会了也只能用在Excel中用;第三种是RPA工具模拟人来物理操作Excel,RP是机器人流程自动化(Robotic process automation)的缩写,不仅可以操作Excel也可以实现其他流程的自动化,这也是我比较推崇的,后续会详细介绍,重点推荐大家了解相关知识,是提高生产力的神器。

这里要介绍的是openpyxl这个操作Excel的库。实际上用Python操作Excel的库有很多,时间上有先后,一些是在改进另一些的基础上产生的,但是这些包在不同的场景下各有其优势,所以没有好坏之分,需要用哪个就用哪个。

下面是一个简单的对比:

除了Pandas(pandas是专门处理大量表格数据的强大工具,openpyxl的很多功能如果使用pandas可以很轻易完成,但是openpyxl的好处是能细化到单元格处理,跟excel融合的很好,这两点是pandas无法比的),我用的最多的就是openpyxl,功能齐全,比较好理解。本篇的目的就是通过一个案例简单展示如何通过openpyxl读取Excel数据,(后续会通过各子篇完成如何修改数据、汇总数据、变换格式、添加图表、保存文件等整个数据分析流程),既学习了如何处理Excel,也完成一个完整的数据分析项目。

需要说明的是,openpyxl虽然操作Excel的功能强大,但读写性能过于糟糕,尤其是写大表时,会占用大量内存,开启read_only和write_only模式后对其性能有大幅提升。

一、安装openpyxl

安装的过程很简单,在anaconda环境里或者CMD命令行里都可以输入以下安装代码:

pip install openpyxl
  • 1
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值