Pandas如何从总表中高效筛选出另一表的值

在数据分析过程中,我们经常会遇到从一张总表中筛选出部分值的需求,这些值可能来自另一张表。Pandas中有几种方法可以实现这个需求,这里详细介绍使用merge()方法进行左连接的方式来高效完成这一任务。


先导入Pandas库:

python
import pandas as pd


然后读取需要筛选的值的表A和总表B:

python
df_a = pd.read_csv('table_a.csv')    
df_b = pd.read_csv('table_b.csv')


使用merge()方法以left join的方式连接表A和表B:

python 
df_merged = pd.merge(df_a, df_b, on='id', how='left')


连接键这里选择id字段,how='left'指定左连接。这样,表A中的所有值都会在连接表df_merged中出现。而表B中额外的值,在df_merged中会以NaN值的形式出现。

接下来使用dropna()方法过滤掉这些NaN值:

python
df_filtered = df_merged.dropna()


最后,df_filtered表就会包含表B中也出现的表A的值。


这种方法实际上实现了一个筛选+去重的过程。通过在总表B中标记出现的值,并过滤掉未出现的值,达到从B表中筛选A表的值的目的。


Pandas的merge和join方法极为强大,可以完成两表之间各种类型的连接操作。熟练掌握它们是成为Pandas高手的必备技能。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

devid008

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值