python pandas isin_python – 如何使用pandas isin用于多个列

我想找到col1和col2的值,其中第一个数据帧的col1和col2都在第二个数据帧中.

这些行应该在结果数据框中:

>披萨,男孩

>披萨,女孩

>冰淇淋,男孩

因为所有三行都在第一个和第二个数据帧中.

我怎么可能做到这一点?我正在考虑使用isin,但是当我不得不考虑多个列时,我不确定如何使用它.

最佳答案 在col1和col2上执行

inner merge:

import pandas as pd

df1 = pd.DataFrame({'col1': ['pizza', 'hamburger', 'hamburger', 'pizza', 'ice cream'], 'col2': ['boy', 'boy', 'girl', 'girl', 'boy']}, index=range(1,6))

df2 = pd.DataFrame({'col1': ['pizza', 'pizza', 'chicken', 'cake', 'cake', 'chicken', 'ice cream'], 'col2': ['boy', 'girl', 'girl', 'boy', 'girl', 'boy', 'boy']}, index=range(10,17))

print(pd.merge(df2.reset_index(), df1, how='inner').set_index('index'))

产量

col1 col2

index

10 pizza boy

11 pizza girl

16 ice cream boy

reset_index和set_index调用的目的是保留df2的索引,就像您发布的所需结果一样.如果索引不重要,那么

pd.merge(df2, df1, how='inner')

# col1 col2

# 0 pizza boy

# 1 pizza girl

# 2 ice cream boy

就够了

index1 = pd.MultiIndex.from_arrays([df1[col] for col in ['col1', 'col2']])

index2 = pd.MultiIndex.from_arrays([df2[col] for col in ['col1', 'col2']])

print(df2.loc[index2.isin(index1)])

产量

col1 col2

10 pizza boy

11 pizza girl

16 ice cream boy

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值