Pandas取交集、并集、差集

最新推荐文章于 2022-10-28 16:11:49 发布

llf_cloud

最新推荐文章于 2022-10-28 16:11:49 发布

阅读量4k

点赞数

分类专栏： pandas 文章标签： pandas

原文链接：https://www.cnblogs.com/kaerxifa/p/13155768.html

版权

pandas 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

前堤条件：对于colums都相同的dataframe做过滤的时候
创建2个结构（列名）一致的DataFrame,df1和df2有1条重合的数据

>>> import pandas as pd
>>>
>>> df1=pd.DataFrame([['a', 10, '男'], ['b', 11, '女']], columns=['name', 'age', 'gender'])
>>>
>>> df2=pd.DataFrame([['a', 10, '男']], columns=['name', 'age', 'gender'])
>>>
>>> df1
  name  age gender
0    a   10      男
1    b   11      女
>>>
>>> df2
  name  age gender
0    a   10      男
>>>
>>> # 取交集
>>> pd.merge(df1, df2, on=['name', 'age', 'gender'])
  name  age gender
0    a   10      男
>>>
>>> # 取并集
>>> pd.merge(df1, df2, on=['name', 'age', 'gender'], how='outer')
  name  age gender
0    a   10      男
1    b   11      女
>>>
>>> # 取差集
>>> df1=df1.append(df2)
>>> df1=df1.drop_duplicates(subset=['name', 'age', 'gender'], keep=False)
>>> df1
  name  age gender
1    b   11      女
>>>

llf_cloud

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
Pandas取交集、并集、差集

前堤条件：对于colums都相同的dataframe做过滤的时候创建2个结构（列名）一致的DataFrame,df1和df2有1条重合的数据>>> import pandas as pd>>>>>> df1=pd.DataFrame([['a',10,'男'],['b',11,'女']],columns=['name','age','gender'])>>>>>> df2=pd.DataFrame([['a
复制链接

扫一扫

专栏目录