pandas的汇总操作

本文详细介绍了pandas中的汇总操作,包括级联与合并。级联主要涉及pd.concat和pd.append,重点讲解了axis参数、join选项以及如何处理重复索引。合并部分则详细阐述了pd.merge的用法,强调了合并的条件、on参数以及不同类型的合并(内合并、外合并、左合并、右合并)。
摘要由CSDN通过智能技术生成

pandas的汇总操作

pandas的拼接分为两种:

  • 级联:pd.concat,pd.append
  • 合并:pd.merge,pd.join

级联的业务应用场景:业务表结构相同或相似

numpy的级联

  1. numpy级联必须保证在级联的方向上,数据个数一致
  2. 如果数据个数不一致,无法级联

pd.concat((df1,df2))
默认是纵向方向级联,两张表的标签顺序可以不一致
以标签为基准
axis=1 行方向级联
axis=0 列方向级联 也是默认值
pandas使用pd.concat函数,与np.concatenate函数类似,只是多了一些参数:

objs:那两张表去级联
axis=0 默认列方向
join=‘outer’ 控制级联方向上标签的取值范围
inner 取多张表的在级联方向上的标签的交集
outer 取多张表在级联方向上的标签的并集

join_axes=None
Index对象列表。用于其他n-1轴的特定索引,而不是执行内部/外部设置逻辑。

ignore_index=False
如果行方向索引重复,可以直接忽略处理
使用整数对行索引进行重新设置

keys
横向级联时,如果产生相同的列标签,应该使用Keys来保存原始的标签值

使用append()函数添加
由于在后面级联的使用非常普遍,因此有一个函数append专门用于在后面添加

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值