pandas基础——变形

本文介绍了pandas库中的数据变形方法,包括透视表的pivot和pivot_table函数,以及crosstab交叉表的使用。详细阐述了如何通过melt进行数据压缩与展开,以及stack和unstack的基础变形操作。此外,还讨论了哑变量的创建,如get_dummies的one-hot编码和factorize方法的自然数编码。这些技巧对于数据分析和预处理至关重要。
摘要由CSDN通过智能技术生成

pandas基础——变形

import numpy as np
import pandas as pd
df = pd.read_csv('data/table.csv')
df.head()

1、透视表
(1)pivot
一般状态下,数据在DataFrame会以压缩状态存放,例如Gender列中F和M一起存放,两个类别被叠在一列中,pivot函数可将某一列作为新的cols

df.pivot(index='ID',columns='Gender',values='Height').head()

(2)pivot_table

pd.pivot_table(df,index='ID',columns='Gender',values='Height').head()
#由于功能更多,运行速度比较慢
%timeit df.pivot(index='ID',columns='Gender',values='Height')
%timeit pd.pivot_table(df,index='ID',columns='Gender',values='Height')

Pandas中提供了各种选项,下面介绍常用参数:

#aggfunc:对组内进行聚合统计,可传入各类函数,默认为mean
pd.pivot_table(df,index='School',columns='Gender',values='Height',aggfunc=
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值