pandas 中的 isin和isnotin

首先声明一下,pandas中是没有isnotin这个方法的,isin方法都比较常用,再一次应用中需要求isin的反集,就自己研究了一下,做个笔记,以后能用得到。
1、直接根据条件进行索引,isin()接受一个列表,判断该列中元素是否在列表中

import pandas as pd
df=pd.DataFrame(np.random.randn(4,4),columns=['A','B','C','D'])
df
Out[189]: 
          A         B         C         D
0  0.289595  0.202207 -0.850390  0.197016
1  0.403254 -1.287074  0.916361  0.055136
2 -0.359261 -1.266615 -0.733625 -0.790208
3  0.164862 -0.649637  0.716620  1.447703
df['E'] = ['aa', 'bb', 'cc', 'cc']
df
Out[191]: 
          A         B         C         D   E
0  0.289595  0.202207 -0.850390  0.197016  aa
1  0.403254 -1.287074  0.916361  0.055136  bb
2 -0.359261 -1.266615 -0.733625 -0.790208  cc
3  0.164862 -0.649637  0.716620  1.447703  cc
df.E.isin(['aa','cc'])
Out[192]: 
0     True
1    False
2     True
3     True
Name: E, dtype: bool
df[df.E.isin(['aa','cc'])]
Out[193]: 
          A         B         C         D   E
0  0.289595  0.202207 -0.850390  0.197016  aa
2 -0.359261 -1.266615 -0.733625 -0.790208  cc
3  0.164862 -0.649637  0.716620  1.447703  cc

2、根据多条件进行索引,此时用&(交集)或者|(并集)进行连接

Out[194]: 
          A         B         C         D   E
0  0.289595  0.202207 -0.850390  0.197016  aa
2 -0.359261 -1.266615 -0.733625 -0.790208  cc
3  0.164862 -0.649637  0.716620  1.447703  cc
df[df.E.isin(['aa'])]
Out[195]: 
          A         B        C         D   E
0  0.289595  0.202207 -0.85039  0.197016  aa

3、通过字典的形式传递多个条件{‘某列’:[条件],‘某列’:[条件],}

df[df.isin({'D':[0,3],'E':['aa','cc']})]
Out[200]: 
    A   B   C    D    E
0 NaN NaN NaN  NaN   aa
1 NaN NaN NaN  NaN  NaN
2 NaN NaN NaN  3.0   cc
3 NaN NaN NaN  NaN   cc

4、接下来就是最重要的isnotin怎么实现了,其实就是 ‘~’ 或许在我说反集的时候就有人想到了

df[~(df.E=='cc')]
Out[202]: 
          A         B         C  D   E
0  0.289595  0.202207 -0.850390  1  aa
1  0.403254 -1.287074  0.916361  2  bb

技术分享如有雷同,请联系删帖,谢谢

  • 14
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
pandas,没有内置的isnotin方法。但是可以通过对isin方法取反来实现类似于isnotin的功能。 举例来说,假设有一个DataFrame df,其包含列a,b和c。我们可以使用isin方法和一个筛选条件来判断数据是否满足条件,并返回一个布尔值的DataFrame,其True表示满足条件,False表示不满足条件。然后,我们可以使用取反运算符~来获取不满足条件的数据。 例如,我们有一个筛选条件为{'a':[1, 2, 3]},我们可以使用以下代码来进行条件筛选: df_in = df[df.isin(filter_condition)['a']] # 获取满足条件的数据 df_notin = df[~df.isin(filter_condition)['a']] # 获取不满足条件的数据 在以上代码,我们使用isin方法和筛选条件来获取满足条件的数据,并将结果存储在df_in。然后,使用取反运算符~来获取不满足条件的数据,并将结果存储在df_notin。 请注意,上述代码的filter_condition是一个字典,用于指定筛选条件。其,键是要筛选的列名,值是要匹配的值的列表。 最后,df_in和df_notin分别存储了满足条件和不满足条件的数据。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [pandas isinisnotin](https://blog.csdn.net/qq_39910261/article/details/106255990)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [pandas的is in和not in](https://blog.csdn.net/weixin_42764612/article/details/89600903)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值