python分析16万数据表格并汇总相同数据_python 处理几十万数据表-CSDN博客

本文链接：https://blog.csdn.net/weixin_47755931/article/details/126588456

因为这几天要进行一个医保基金飞行检查，今天接到一个任务，需要分析一个16万6千数据的表格。
表格如下：
在这里插入图片描述

任务要求：相同医保项目名称和单价的，汇总数量和金额。（注意相同名称不同单价的另算一组数据）
因为一个名称可能有多个单价，第一次碰到这种判断条件有两个的数据分析，想到要用字典来处理。经过思考，决定使用{(医保名，单价):[汇总数量，汇总金额]}的方式来储存数据。
代码如下：

import pandas as pd
import os


def total(path):
    # {(医保名，单价):[汇总数量，汇总金额]}---数据存储类型,字典嵌套元组和列表
    df1 = pd.read_excel(path, sheet_name=1)
    namelist = []
    pricelist = []
    frequencylist = []
    amountlist = []
    dict1 = {}
    price_col = df1.columns.get_loc('单价')
    frequency_col = df1.columns.get_loc('数量')
    name_col = df1.columns.get_loc('医保项目名称')
    amount_col = df1.columns.get_loc('金额')
    save_path = os.path.split(path)[0]  # 获取原文件的路径
    filename =