pandas之combine_first() 合并重叠数据(修补)

最新推荐文章于 2024-02-22 17:01:17 发布

林中有神君

最新推荐文章于 2024-02-22 17:01:17 发布

阅读量5.2k

点赞数 5

分类专栏： python系列文章标签： python

本文链接：https://blog.csdn.net/weixin_46457946/article/details/109785082

版权

python系列专栏收录该内容

23 篇文章 1 订阅

订阅专栏

数据合并处理中，还有一种数据组合的处理方法，那就是合并重叠数据我也把他叫修补

合并重叠数据使用 combine_first() 函数，该函数的语法格式如下。

 obj1.combine_first(obj2)

其中，obj1 为函数调用对象的数据集；obj2 为函数参数对象的数据集。

该函数的作用是用函数参数对象中的数据为函数调用对象的缺失数据“打补丁”，即填充函数调用对象中的数据缺失值。

代码如下：

import numpy as np
import pandas as pd
print("========#修补pd.combine_first()========")
df1=pd.DataFrame([[np.nan, 3., 5.], [-4.6,np.nan,np.nan],[np.nan,7.,np.nan]])
df2=pd.DataFrame([[-42.6,np.nan,-8.2],[-5.,1.6,4]],index=[1,2])
print(df1)
print(df2)
print(df1.combine_first(df2))#根据index,def的空值被df2代替

运行结果：
在这里插入图片描述
可以看到df1是三行，df2是两行，combine_first(df2)函数的意义就是填充，修补。df1把df2没有的第一行修补上。而且以0为行索引的值没变

可以对比df1与df2行索引对应的值

df1
在这里插入图片描述
df2

合并后：

对比之下可以看出，两个都是none的，合并之后还是none，一个是none，另一个不是的那将none填充。

例二：

print("------------例二：---------------")
df1=pd.DataFrame({'A':[None,0],'B':[None,4]})
df2=pd.DataFrame({'A':[1,1,1],'B':[3,3,3]})
print(df1)
print(df2)
print(df1.combine_first(df2))