本篇文章将带你了解报表自动化的流程,并教你用Python实现工作中的一个报表自动化实战,篇幅较长,建议先收藏,文章具体的目录为:
1.Excel的基本组成
2.一份报表自动化的流程
3.报表自动化实战
- 当日各项指标同环比情况
- 当日各省份创建订单量情况
- 最近一段时间创建订单量趋势
4.将不同的结果进行合并 - 将不同结果合并到同一个Sheet中
- 将不同结果合并到同一个工作簿的不同Sheet中
Excel的基本组成
我们一般在最开始做报表的时候,基本都是从Excel开始的,都是利用Excel在做报表,所以我们先了解下Excel的基本组成。最后,如果你的时间不是很紧张,并且又想快速的python提高,最重要的是不怕吃苦,建议你可以价位♥(同音):762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~
下图是Excel的中各个部分的组成关系,我们工作中每天会处理很多Excel文件,一个Excel文件其实就是一个工作簿。你在每次新建一个Excel文件时,文件名都会默认是工作簿x,其中x就是你新建的文件个数。而一个工作簿里面又可以有多个Sheet,不同Sheet之间是一个独立的表。每一个Sheet里面又由若干个单元格组成。每一个单元格又有若干的元素或属性,我们一般针对Excel文件进行设置最多的其实就是针对单元格的元素进行设置。
而针对单元格元素进行设置的主要内容其实就是如下图菜单栏中显示,比如字体、对齐方式、条件格式等内容。本书也是按照Excel菜单栏中的各个模块进行编写。
一份自动化报表的流程
下图是我整理的做一份自动化报表需要经历的流程,主要分为5个步骤:
第一步是对要做的报表进行步骤拆解,这个步骤拆解和用不用工具或者是用什么工具没有直接关系,比如做报表的第一步一般都是收集数据,这个数据可能是线下人员记录在纸质笔记本上的,也可能是存储在Excel表里面的,还有可能是存储在数据库里面的。会因为数据源的类型或者是存储方式不同,对应的收集数据方式会不一样,但是收集数据这个步骤本身是不会变的,这个步骤的目的就是把数据收集过来。
第二步是去想第一步里面涉及到的每一个具体步骤对应的代码实现方式,一般都是去找对应每一步的代码,比如导入数据的代码是什么样的,再比如重复值删除的代码是什么样的。
第三步是将第二步中各个步骤对应的代码进行组合,组合成一个完整的代码。
第四步是对第三步完整代码得出来的报表结果进行验证,看结果是否正确。
第五步就是等待调用,看什么时候需要制作报表了,然后就将写好的代码执行一遍就行。
其实报表自动化本质上就是让机器代替人工做事情的过程,我们只需要把我们人工需要做的每一个步骤转化成机器可以理解的语言,也就是代码,然后让机器自动去执行,这其实就是实现了自动化。
报表自动化实战
这一节给大家演示下在实际工作中如何结合Pandas和openpyxl来自动化生成报表。
假设我们现在有如下一份数据集:
现在我们需要根据这份数据集来制作每天的日报情况,会主要包含三方面:
- 当日各项指标的同环比情况;
- 当日各省份创建订单量情况;
- 最近一段时间创建订单量趋势
接下来分别来实现这三部分。
当日各项指标的同环比情况:
我们先用Pandas对数据进行计算处理,得到各指标的同环比情况,具体实现代码如下:
#导入文件 import pandas as pd df = pd.read_excel(r'D:\Data-Science\share\excel-python报表自动化\sale_data.xlsx') #构造同时获取不同指标的函数 def get_data(date): create_cnt = df[df['创建日期'] == date]['order_id'].count pay_cnt = df[df['付款日期'] == date]['order_id'].count receive_cnt = df[df['收货日期'] == date]['order_id'].count return_cnt = df[df['退款日期'] == date]['order_id'].count return create_cnt,pay_cnt,receive_cnt,return_cnt #假设当日是2021-04-11 #获取不同时间段的各指标值 df_view = pd.DataFra