pandas中高级表处理

文章详细介绍了Pandas库中用于数据转换的关键函数,包括pivot用于长宽表转换,pivot_table处理非唯一性数据,melt进行反向转换,wide_to_long宽表转长表,以及crosstab和explode函数在统计和展开列表数据时的应用。这些工具帮助数据分析师更有效地组织和分析数据。
摘要由CSDN通过智能技术生成

前言

这些操作很少用到,但是看到也要看得懂,有时候用起来会方便些。

pandas中长表和宽表

长表和宽表的概念:

  1. 长表是某个特征的属性名作为一列

  1. 宽表式某个特征的属性值作为一列

长宽表只是数据呈现方式的差异,但其包含的信息量是等价的

举例如下:

pandas中pivot图解

对于一个基本的长宽变换操作而言,最重要的有三个要素,分别是变形后的行索引,需要转到列索引的列,以及这些列和行索引对应的数值,它们分别对应了pivot方法中的index,columns,values参数。新生成表的列索引是columns对应列的unique值,而新表的行索引是index对应列的unique值,而values对应了想要展示的数值列。

利用pivot进行变形操作需要满足唯一性的要求,即由于在新表中的行列索引对应了唯一的value。

pandas中pivot_table图解

pivot的使用依赖于唯一性条件,那如果不满足唯一性条件,那么必须通过聚合操作使得相同行列组合对应的多个值变为一个值。此时就无法通过pivot函数来完成。pandas中提供了pivot_table来实现,其中的aggfunc参数就是使用的聚合函数。

pandas中melt图解

df.melt()是df.pivot()逆转操作函数。简单说就是将指定的列铺开放到行上名为variable列,值在value列。

pandas中wide_to_long图解

宽表转长表:

pandas中crosstab图解

crosstab用于统计分组频率的特殊透视表,可以处理分类数据它可用于将两个或多个变量分组,并为每组的给定值执行计算。简单来说,就是将两个或者多个列中不重复的元素组成一个新的DataFrame,新数据的行列交叉的部分值为其组合在原始数据中的数量。

pandas中explode

explode函数能够对某一列的元素进行纵向的展开,被展开的单元格必须存储list,tuple

,series,np.ndarray等等。

举例如下:

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wugou2014

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值