每日一题9:Pandas-填充缺失值

一、每日一题

DataFrame products

-------------+--------+
| Column Name | Type   |
+-------------+--------+
| name        | object |
| quantity    | int    |
| price       | int    |
+-------------+--------+

编写一个解决方案,在 quantity 列中将缺失的值

编写一个解决方案,在 quantity 列中将缺失的值填充为 0

返回结果如下示例所示。

 

 解答:

import pandas as pd

def fillMissingValues(products: pd.DataFrame) -> pd.DataFrame:
    products['quantity'] = products['quantity'].fillna(0)
    return products

题源:力扣 

二、总结

fillna() 是 Pandas 库中一个非常实用的方法,用于处理缺失数据(通常表示为 NaN 值)。这个方法可以以多种方式填充DataFrame或Series中的缺失值。以下是 fillna() 方法的一些基本用法和参数总结:

基本用法

1.填充固定值
df.fillna(value, inplace=False)
  • value: 用于替换缺失值的具体值。可以是标量(如0、'missing'等)、列表、字典或Series。
  • inplace: 默认为 False,意味着操作不会改变原数据,而是返回一个新的对象。如果设置为 True,则直接在原始数据上进行修改。
2.前向填充或后向填充
df.fillna(method='ffill' or 'bfill', limit=None, inplace=False)
  • method: 可以是 'ffill'(前向填充,使用前面的非空值填充缺失值)或 'bfill'(后向填充,使用后面的非空值填充缺失值)。
  • limit: 指定连续缺失值填充的最大数量。

参数说明

  • axis: 默认为 0,即按列进行填充。如果设置为 1,则沿着行进行操作。

  • limit: 当使用 ffillbfill 方法时,限制连续NaN值被填充的最大数量。

  • downcast: (可选)尝试向下转换数据类型以节省内存,例如从 float64 转换为 float32

实例

1.常值填充
df['column_name'].fillna(0, inplace=True)
2.使用列的均值填充:
df['column_name'].fillna(df['column_name'].mean(), inplace=True)
3.前向填充
df.fillna(method='ffill', inplace=True)

参考官方文档

  • 14
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
在pandas中,可以使用fillna()函数来填充缺失。该函数的主要参数包括value、method、axis、inplace、limit等。其中,value参数用于指定填充,method参数用于指定填充的方法,axis参数用于指定填充的方向,inplace参数用于指定是否在原数据上进行填充,limit参数用于指定每列或每行连续填充的最大数量。 例如,可以使用向前填充(ffill)的方法来填充缺失。首先,将DataFrame中的缺失替换为NaN,然后使用fillna()函数进行填充。可以使用df.fillna(value=None, method='ffill', axis=0, limit=None)来实现列向前填充。同样地,可以使用向后填充(bfill)的方法来填充缺失。可以使用df.fillna(value=None, method='bfill', axis=0, limit=None)来实现列向后填充。\[2\] 需要注意的是,向前填充和向后填充都无法填充首行和末行的缺失。为了解决这个问,可以先使用向前填充,然后再使用向后填充的方法进行填充。这样可以保证所有的缺失都得到填充。\[3\] 以下是一个完整的示例代码,展示了如何使用pandas填充缺失: ```python import pandas as pd import numpy as np # 读取数据 data = pd.read_excel("待填充数据.xlsx", sheet_name="房间数", index_col="月份") # 将0转化为空 data\[data == 0\] = np.nan # 过滤空过多的列 df = data.dropna(axis=1, thresh=11, subset=None, inplace=False) # 列向前填充 df1 = df.fillna(value=None, method='ffill', axis=0, limit=None) # 列向后填充,避免首行空 df2 = df.fillna(value=None, method='bfill', axis=0, limit=None) # 将结果保存到Excel文件 df2.to_excel("清洗填充结果.xlsx") ``` 这段代码首先读取了一个Excel文件中的数据,然后将其中的0替换为NaN。接着,过滤了空过多的列,然后使用向前填充和向后填充的方法进行缺失填充。最后,将填充后的结果保存到了另一个Excel文件中。\[3\] #### 引用[.reference_title] - *1* *2* [pandas缺失填充](https://blog.csdn.net/weixin_46969441/article/details/119859689)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [pandas空填充](https://blog.csdn.net/zengbowengood/article/details/103033654)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值