Day 32 : Pandas 布尔索引,数据处理

Python回忆录2020/11/04Pandas 布尔索引Pandas 缺失数据问题2020/11/04Pandas 布尔索引对于布尔索引 可能还有其他的条件 来挑选。在DataFrame里 用括号把每个条件括起来和 & 符号 连接df[( 800<df["Count_AnimalName"] ) & ( df["Count_AnimalName"]< 1000 )]& 是且| 是或Pandas 缺失数据一般数据缺失 就补充为NaN(和np.nan
摘要由CSDN通过智能技术生成

2020/11/04

Pandas 布尔索引

对于布尔索引 可能还有其他的条件 来挑选。
在DataFrame里 用括号把每个条件括起来和 & 符号 连接
df[( 800<df["Count_AnimalName"] ) & ( df["Count_AnimalName"]< 1000 )]

& 是且
| 是或

Pandas 缺失数据

一般数据缺失 就补充为NaN(和np.nan 一样) 或者让缺失的数据为0
1.判断数据是否为NaN:pd.isnull(df) 或者是 pd.notnull(df)
2.然后再对空数据进行处理

  • 删除NaN所在的行列 dropna(axis = 0,how="any",implace=False)这是直接删除一行或者一列。 how后面的any 就是有一个就删除。all 就是全部才删除;inplace 就是是否进行原地修改
  • 填充数据到NaN的位置上。fillna(df.mean())就是填充数字

数值在变成NaN的时候,后面经过计算就会跳过NaN
有时候数据为0的时候 也要进行判断。因为有些0是有意义的,但还有一些0是人为添加的,这时候在计算的时候 就要变成NaN

问题

对于一组电影数据,如果我们想rating,runtime的分布情况,应该如何呈现数据?


                
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值