目录
输入数据样子:
t3= pd.DataFrame({'key':['a','b','c','c'],'key2':['a','c','c','c'],'data':range(4)})
t4如图:
t4= pd.DataFrame({'key':['X','b','b','X'],'key2':['a','c','c','X'],'data':range(4)})
how属性合并的四种方式:
t1 = pd.merge(t3,t4,on=['key','key2'],how='inner')
t1 = pd.merge(t3,t4,on=['key','key2'],how='left')
t1 = pd.merge(t3,t4,on=['key','key2'],how='right')
t1 = pd.merge(t3,t4,on=['key','key2'],how='outer')
inner:在on的列上两方均有的数据,即交集
left:左侧作为被匹配对象,右侧的数据匹配左侧的数据,没有的则为空。未匹配到,则为空
right:右侧作为被匹配对象,左侧的数据匹配右侧的数据,没有的则为空。未匹配到,则为空
outer:并集,所有的元素都有
(其中的on为对应在那几列上进行的操作)
inner结果如图:
left结果如图:
reght结果如图:
out结果如图:
,
根据索引号处理数据
输入数据样子:
t3:四行三列
t3= pd.DataFrame({'key':['a','b','c'],'key2':['a','c','c'],'data':range(3)})
t4:三行三列
t4= pd.DataFrame({'key':['X','b','b','X'],'key2':['a','c','c','X'],'data':range(4)})
输出:使用左侧序列进行处理,因为how默认为inner所以显示为交集,可以结合how其他形式
t1 = pd.merge(t3,t4,right_index=True,left_index=True)
总结:merge的处理方式类似与数据库表的连接方式。
觉着我的文章思路清晰的话可以点赞关注下。便于大家以后的查找
我也是从大家的文章视频中一步一步学习到现在,希望取之于民,用之于民。希望可以让大家在以后的路上少走弯路。