Python数据分析神器——pandas(进阶教程)

本文详细介绍了Python数据分析库pandas的高级用法,包括数据集合并(如merge、concat、combine_first),索引合并,轴向连接,重叠数据处理,数据重塑与旋转,以及数据转换如去除重复项、利用函数转换、替换值等操作。通过实例展示了pivot、stack、unstack等函数的使用,以及离散化和面元划分的方法。
摘要由CSDN通过智能技术生成

合并数据集

pandas对象中的数据可以通过一些内置的方式进行合并:

  • pandas.merge 可以根据一个或多个键将不同DataFrame中的行连接起来
  • pandas.concat 可以沿着一条轴将多个对象堆叠到一起
  • 实例方法 combine_first 可以将重复数据连接在一起,用一个对象中的值填充另一个对象中的缺失值

默认情况下,merge做的是“inner”连接,结果中的键是交集。其他方式还有“left”、“right”以及“outer”。外连接求取的是键的并集,组合了左连接和右连接的效果
多对多连接产生的是行的笛卡尔积
在进行列——列连接时,DataFrame对象中的索引会被丢弃

在这里插入图片描述

索引的合并

有时候,DataFrame中的连接键位于其索引中。在这种情况下,可以传入left_index=True或right_index=True(或两个都传)以说明索引应该被用作连接键。

对于层次化索引的数据,必须以列表的形式指明用作合并键的多个列

DataFrame还有一个join实例方法,它能更为方便地实现按索引合并。它还可用于合并多个带有相同或相似索引的DataFrame对象,而不管它们之间有没有重叠的列

轴向连接

pandas的concat函数提供了轻松完成轴向连接的可靠方式
默认情况下,concat是在axis=0上进行合并,当然,我们也可以令axis=1
在这里插入图片描述

在这里插入图片描述

合并重叠数据

combine_first方法可以实现合并重叠数据,并且会进行数据对齐

df1 = pd
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值