pandas的groupby以及pivot_table用法——以计算恩格尔系数为例

本文通过Datacastle大学生资助预测竞赛数据,利用pandas的groupby和pivot_table函数,展示如何计算恩格尔系数。两种方法得出相同结果,强调数据透视表在数据分析中的便利性,同时推荐使用to_csv方法保存结果,指出pandas在统计处理中的优势,特别是unstack函数的独特作用。
摘要由CSDN通过智能技术生成

数据:来源于Datacastle上的大学生资助预测竞赛中的数据,点此百度网盘获取,密码为cdtb。
注:只用到竞赛中的一卡通数据

数据描述
一共有一万多条数据,800多兆,共七个字段,分别是:
【学生ID,消费类别,消费地点,消费方式,消费时间,消费金额,剩余金额】

Task:
根据该数据,得到如下格式:

solution1: groupby()

data = pd.read_csv('card_train.txt')
dat
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值