Python使用groupby()+ffill()根据指定列填充缺失值

最新推荐文章于 2024-07-19 00:06:35 发布

Avasla

最新推荐文章于 2024-07-19 00:06:35 发布

阅读量2.4k

点赞数

分类专栏：其他 Python 文章标签： python pandas

本文链接：https://blog.csdn.net/WHYbeHERE/article/details/128680916

版权

Python 同时被 2 个专栏收录

61 篇文章 16 订阅

订阅专栏

其他

30 篇文章 4 订阅

订阅专栏

ffill() 使用方法介绍

参考链接：
https://www.geeksforgeeks.org/python-pandas-dataframe-ffill/

# importing pandas as pd
import pandas as pd
 
# Creating the dataframe
df=pd.DataFrame({"A":[5,3,None,4],
                 "B":[None,2,4,3],
                 "C":[4,3,8,5],
                 "D":[5,4,2,None]})
 
# Print the dataframe
df

在这里插入图片描述

按行填充

引用上一行的值填充：缺点是无法填充第一行缺失值

#按axis = 0填充
df.ffill(axis = 0)

在这里插入图片描述

按列填充

引用上一列的值填充：缺点是无法填充第一列缺失值

#按axis = 1填充
df.ffill(axis = 1)

在这里插入图片描述

groupby() + ffill()

先建立一个DF, 有城市名称和邮编号，其中邮编部分缺失，需要根据城市名称去进行填充缺失值。

df=pd.DataFrame({"city":['Beijing','Shanghai','Tianjing','Beijing','Shanghai'],
                 "zip_code":[100000,200000,300000,None,None],
                 "UID":[1,2,3,4,5],
                 "Order_ID":[100,111,223,333,4444]})
df

在这里插入图片描述

#groupby 和fill 组合使用，返回的结果可见缺失值已经补充完成
df.groupby('city')['zip_code'].ffill()

在这里插入图片描述

#替换掉原来的列
df['zip_code']=df.groupby('city')['zip_code'].ffill()
df

在这里插入图片描述
缺失值已经填补成功

Avasla

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录