python实现报表自动化1

python 实现报表自动化1

  1. 报表介绍
    现有3张表,一张为交付表,一张为22年销售表,还有一张21年的销售表;
    交付表表头如下:
    此表为交付表表头
    21年、22年销售表头如下:
    在这里插入图片描述
    报表目的,将22年和21年的购进金额添加到F、G列,并且将22年新增的终端名称累加到新增的交付表下面。

  2. 自动化代码如下:

import pandas as pd

#忽略warning警告
import warnings
warnings.filterwarnings('ignore')

################################################## 修改文件名
#导入文件
df_22 = pd.read_excel('22年终端销售分析.xlsx')
df_21 = pd.read_excel('21年终端销售分析.xlsx')
df_jf = pd.read_excel('DDI直连清单-20220826.xlsx')

# 参数赋值
last_year = '21年8月购进'    ##############
this_year = '22年8月购进'    ##############
file_ddi = 'DDI直连清单-20220902.xlsx'      ##############################修改文件名


#屏蔽报错——SettingWithCopyWarning
pd.set_option('mode.chained_assignment', None)

#对齐参数
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)

#处理交付表
#删除交付表21年与22年金额列
df_jf1 = df_jf.drop(labels=[last_year,this_year],axis = 1)  #删除交付表最后2列,方便后续合并,删除后不改变原表df_jx

#处理22年销售表
#为了找出新增终端,只保留:终端名称、省市区、终端类型几列, 并把删除后表头中”客户省、客户市、客户区“替换为”省、市、区“
df_22_1 = df_22[["终端名称","客户省","客户市","客户区","终端类型"]]
#删除df_22_1索引为0的行
df_22_1.drop(df_22_1.index[0], inplace=True)


#修改列名
df_22_1.rename(columns={'客户省':'省','客户市':'市','客户区':'区'}, inplace = True)

#将22年新增终端增到交付表中
#交付表与22表交集部分
df_jj = pd.merge(df_22_1, df_jf1, on=['终端名称'])
# df_jj.to_excel('df_jj.xlsx')

#差集——用22销售表减去22年与交付表的交集,得到22年7月新增部分终端
df_xinzeng = pd.concat([df_22_1,df_jj]).drop_duplicates(subset=['终端名称'],keep=False)

#删除交集与差集合并后的多余列
df_xinzeng = df_xinzeng.drop(labels=['省_x','市_x', '区_x', '终端类型_x','省_y' ,'市_y', '区_y', '终端类型_y'],axis = 1)
# df_xinzeng.to_excel('df_xinzeng.xlsx')

#将新增的终端放到交付表中
df_jf_res = pd.merge(df_jf1, df_xinzeng, on=['终端名称','省','市','区','终端类型'], how='outer')
# df_jf_res.to_excel('2.xlsx')


#将21年金额放到交付表
#删除21年索引为0的行
df_21.drop(df_21.index[0], inplace=True)

#筛选df_jf_res需要的两列
df_21=df_21[["终端名称","合计.1"]]

# 合并df_jf_res与df_21中的金额
df_jf_res = pd.merge(df_jf_res,df_21,how="left",on="终端名称")

#将合并表的21年金额更名
df_jf_res.rename(columns={'合计.1':last_year}, inplace = True)

#将21年金额列数值中”,“替换掉
df_jf_res[last_year] = df_jf_res[last_year].str.replace(',','')
df_jf_res[last_year] = pd.to_numeric(df_jf_res[last_year],errors='raise')
# 将交付表中21年金额为空的填充为0
df_jf_res.fillna(0,inplace=True)



#将22年金额放到交付表
#删除22年索引为0的行
df_22.drop(df_22.index[0], inplace=True)
#筛选df_jf_res需要的两列
df_22=df_22[["终端名称","合计.1"]]

# 合并df_jf_res与df_22中的金额
df_jf_res = pd.merge(df_jf_res,df_22,how="left",on="终端名称")

#将合并表的22年金额更名
df_jf_res.rename(columns={'合计.1':this_year}, inplace = True)

#将22年金额列数值中”,“替换掉
df_jf_res[this_year] = df_jf_res[this_year].str.replace(',','')
df_jf_res[this_year] = pd.to_numeric(df_jf_res[this_year],errors='raise')
# 将22年金额为空的填充为0
df_jf_res.fillna(0,inplace=True)


#输出文件
df_jf_res.to_excel(file_ddi,index=False)


#修改列宽
file_path = './DDI直连清单-20220902.xlsx'      ####################修改文件名
sheet_name = 'Sheet1'

with pd.ExcelWriter(file_path, engine='xlsxwriter') as writer:
    # 数据传给Excel的writer
    df_jf_res.to_excel(writer, index=False, sheet_name=sheet_name)
    # 再从writer加载回该sheet
    worksheet = writer.sheets[sheet_name]
    # 循环每一列的列序号,设置列宽为20个单位(指Excel中的列宽单位)
    # for idx in range(df_jf_res.shape[1]):
    #     print(df_jf_res.shape[1])
    worksheet.set_column(0,0, 60)
    worksheet.set_column(5,6, 15)    # .set_column(a,b,c)函数三个参数,a代表起始列,b代表终止列,c为列宽
    # worksheet.set_column(6, 6, 15)
    writer.save()   # 保存文件
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我是小bā吖

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值