使用python统计excel两文件的数据并匹配地市
需求:给出的详单为0712.xls文件,统计地市列北京、上海、广州、深圳一线的数据有多少?
源文件数据0712.xls
import pandas as pd
df = pd.read_excel('0712.xls')
city = pd.DataFrame(
{'地市': ['北京', '上海', '广州', '深圳', '全区']})
# 自定义统计方法
def total_sj(data, name):
"""
:param data:
:param name:
:return:
"""
table = data.groupby(['地市']).size().reset_index(name=name)
table = table.append([{'地市': '全区', name: table.apply(lambda x: x.sum())[name]}], ignore_index=True)
return table
# 统计数据
table_tj = pd.merge(city, total_sj(df, '一线数据'),
on=['地市'], how='left') # 一线数据
# 数据写入excel文件
table_tj.to_excel("一线数据写入.xlsx", sheet_name='地市', startcol=0, index=False)
print(table_tj)
print("写入完毕")
print("数据写入成功,文件输出成功")
结果截图:
如有需要请留言评论哦。