Pandas常见方法（5）-DataFrame逐列填补Nan值

Efred.D

已于 2022-07-01 21:33:27 修改

阅读量3.6k

点赞数

分类专栏： Pandas学习数据分析文章标签： python 机器学习数据挖掘

于 2022-01-12 10:30:30 首次发布

本文链接：https://blog.csdn.net/dylan_young/article/details/122447634

版权

数据分析同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

Pandas学习

6 篇文章 0 订阅

订阅专栏

说明：本blog基于python3版本, pandas 1.3.5

文章目录

前言
代码实例

前言

我们在日常工作中,拿到第一手的数据集通常有很多nan值;

本文介绍一种根据DataFrame2 来逐列填补DataFrame1 中nan 值的方法,
公式: DataFrame1.combine_first(DataFrame2), 返回一个DataFrame1和DataFrame2 长度,宽度分别取DataFrame1和DataFrame2最大值的新的DataFrame

代码实例

import pandas as pd
import numpy as np
a = pd.DataFrame([[1,3,np.nan,9],
				  [np.nan, 89,76,26]], index = ["a","b"])
b = pd.DataFrame([[1,3,9],
				  [22, 8,0],
				  [77, np.nan,80]], index = ["a","c","f"])
print(a)
print(b)
c = a.combine_first(b)
print(c)

结果如下,

     0   1     2   3
a  1.0   3   NaN   9
b  NaN  89  76.0  26
    0    1   2
a   1  3.0   9
c  22  8.0   0
f  77  NaN  80
      0     1     2     3
a   1.0   3.0   9.0   9.0
b   NaN  89.0  76.0  26.0
c  22.0   8.0   0.0   NaN
f  77.0   NaN  80.0   NaN

由此可知, a 和 b 生成的新的Dataframe 是一个长宽分别为4,4的二维数据

Efred.D

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Pandas常见方法（5）-DataFrame逐列填补Nan值

说明：本blog基于python3版本, pandas 1.3.5文章目录前言代码实例前言我们在日常工作中,拿到第一手的数据集通常有很多nan值;本文介绍一种根据DataFrame2 来逐列填补DataFrame1 中nan 值的方法,公式: DataFrame1.combine_first(DataFrame2), 返回一个DataFrame1和DataFrame2 长度,宽度分别取DataFrame1和DataFrame2最大值的新的DataFrame代码实例import panda
复制链接

扫一扫