如何处理DataFrame丢失数据

如何处理DataFrame丢失数据

# 处理丢失数据                                                                                    
dates = pd.date_range('20130101', periods=6)                                                
df = pd.DataFrame(np.arange(24).reshape((6, 4)), index=dates, columns=['A', 'B', 'C', 'D']) 
                                                                                            
df.iloc[0, 1] = np.nan                                                                      
df.iloc[1, 2] = np.nan                                                                      
``
# 如果想直接去掉有 NaN 的行或列, 可以使用 dropna                                        
df_drop = df.dropna(                                                    
    axis=0,  # 0: 对行进行操作; 1: 对列进行操作                                     
    how='any'  # 'any': 只要存在 NaN 就 drop 掉; 'all': 必须全部是 NaN 才 drop      
)                                                                       
print(df_drop)                                                          
print(df.fillna(value=0))  # 如果是将 NaN 的值用其他值代替, 比如代替成 0:                
print(pd.isnull(df))        

结果图片

df_drop输出结果
fillna & isnull结果

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值