pandas的merge数据处理详解,包括交集、并集、还有使用索引上的处理

目录

输入数据样子:

how属性合并的四种方式:

根据索引号处理数据

输入数据样子:

t3如图:

t3= pd.DataFrame({'key':['a','b','c','c'],'key2':['a','c','c','c'],'data':range(4)})

t4如图:

t4= pd.DataFrame({'key':['X','b','b','X'],'key2':['a','c','c','X'],'data':range(4)})

how属性合并的四种方式:

t1 = pd.merge(t3,t4,on=['key','key2'],how='inner')
t1 = pd.merge(t3,t4,on=['key','key2'],how='left') 
t1 = pd.merge(t3,t4,on=['key','key2'],how='right') 
t1 = pd.merge(t3,t4,on=['key','key2'],how='outer')

inner:在on的列上两方均有的数据,即交集

left:左侧作为被匹配对象,右侧的数据匹配左侧的数据,没有的则为空。未匹配到,则为空

right:右侧作为被匹配对象,左侧的数据匹配右侧的数据,没有的则为空。未匹配到,则为空

outer:并集,所有的元素都有

(其中的on为对应在那几列上进行的操作

inner结果如图:

left结果如图:

reght结果如图:

out结果如图:

根据索引号处理数据

输入数据样子:

t3:四行三列

t3= pd.DataFrame({'key':['a','b','c'],'key2':['a','c','c'],'data':range(3)})

t4:三行三列

t4= pd.DataFrame({'key':['X','b','b','X'],'key2':['a','c','c','X'],'data':range(4)})

输出:使用左侧序列进行处理,因为how默认为inner所以显示为交集,可以结合how其他形式

t1 = pd.merge(t3,t4,right_index=True,left_index=True)

总结:merge的处理方式类似与数据库表的连接方式。

觉着我的文章思路清晰的话可以点赞关注下。便于大家以后的查找

我也是从大家的文章视频中一步一步学习到现在,希望取之于民,用之于民。希望可以让大家在以后的路上少走弯路。

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值