python进行数据分析

合并数据集

数据库的合并(merage)与连接(join)运算是通过一个或多个键将行链接起来的
  • 默认情况下,merage做的是"inner"连接,结果中的键是交集
df1 = DataFrame({'key' : ['b','b','a','c','a','a','b'],'data1' : range(
    ...: 7)})
   
 df2 = DataFrame({'key' : ['a','b','d'],'data2' : range(3)})

  pd.merge(df1,df2)    
  • 改变以下df2
df2 = DataFrame({'key' : ['a','b','c'],'data2' : range(3)})

pd.merge(df1,df2) 
  • 如果没有指明用哪个列进行连接,merge就会将重叠的列名当作键
df1 = DataFrame({'key' : ['b','b','a','c','a','a','b'],'data' : range(7
    ...: )}) 

df2 = DataFrame({'key' : ['a','b','c'],'data' : range(3)})   

pd.merge(df1,df2,on = 'data')   
  • 默认情况下可将多个重叠列名当键
pd.merge(df1,df2) 
  • 当然,当两个对象的列名不同时,可以分别进行指定
 df1 = DataFrame({'key' : ['b','b','a','c','a','a','b'],'data1' : range(
    ...: 7)}) 

df2 = DataFrame({'key' : ['a','b','c'],'data2' : range(3)})  

pd.merge(df1,df2,left_on = 'data1',right_on = 'data2')   
  • merge还有其他连接方式,如 ‘left’.‘right’.‘outer’
df2 = DataFrame({'key' : ['a','b','d'],'data2' : range(3)})

pd.merge(df1,df2,how = 'outer')   

pd.merge(df1,df2,how = 'left') 

pd.merge(df1,df2,how = 'left') 

  • 前面讲的都是df2每个元素只有一个的情况,当多对多连接时,进行的是行的笛卡尔积
df1 = DataFrame({'key' : ['b','b','a','c','a','b'],'data1':range(6)}) 

df2 = DataFrame({'key':['a','b','a','b','d'],'data2':range(5)})  

pd.merge(df1,df2,on='key',how = 'left') 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

聆一

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值