pands库的merge方法

上面我说了join和concat方法的使用说明,在这里我说下merge方法的用法。

merge

pandas的merge方法提供了一种类似于sql的内存连接操作,官方文档有说明。

1,和sql语句的对比

merge的参数

on:列名,join用来对齐的那一列的名字,用到这个参数的时候一定要左表和右表

用来对齐的列都有相同的列名。

left_on:左表对齐的列,可以是列名,也可以是和dataframe同样长度的arrays。

right_on:右表对齐的列,可以是列名,也可以是和dataframe同样长度的arrays。

left_index/right_index:如果是True的haunted作为对齐的key

how:数据融合的方法。(在dandas的join方法里有简单介绍)

sort:根据dataframe合并的keys按字典顺序排序。

2,复合key的合并方法

通过on指定数据合并对齐的列

left = pd.DataFrame({'key1': ['K0', 'K0', 'K1', 'K2'], 'key2': ['K0', 'K1', 'K0', 'K1'],  'A': ['A0', 'A1', 'A2', 'A3'],'B': ['B0', 'B1', 'B2', 'B3']})

right = pd.DataFrame({'key1': ['K0', 'K1', 'K1', 'K2'],'key2': ['K0', 'K0', 'K0', 'K0'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']})

result = pd.merge(left, right, on=['key1', 'key2'])

注意:没有指定how的话默认使用inner方法。

how的方法有以下:

left

只保留左表的所有数据

result=pd.merge(left,right,how='left',on=['key1','hey2'])

right

只保留右表的所有数据

result = pd.merge(left,right,how='right',on=['key1','key2'])

outer

保留两个表的所有信息

result = pd.merge(left,right,how='outer',on=['key1','key2'])

inner

只保留两个表中公共部分的信息

result = pd.merge(left,right,how='inner',on=['key1','key2'])

#以上是merge的方法,有问题请指正。

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值