Python回忆录
2020/11/04
Pandas 布尔索引
对于布尔索引 可能还有其他的条件 来挑选。
在DataFrame里 用括号把每个条件括起来和 & 符号 连接
df[( 800<df["Count_AnimalName"] ) & ( df["Count_AnimalName"]< 1000 )]
& 是且
| 是或
Pandas 缺失数据
一般数据缺失 就补充为NaN(和np.nan 一样) 或者让缺失的数据为0
1.判断数据是否为NaN:pd.isnull(df) 或者是 pd.notnull(df)
2.然后再对空数据进行处理
- 删除NaN所在的行列
dropna(axis = 0,how="any",implace=False)
这是直接删除一行或者一列。 how后面的any 就是有一个就删除。all 就是全部才删除;inplace 就是是否进行原地修改 - 填充数据到NaN的位置上。
fillna(df.mean())
就是填充数字
数值在变成NaN的时候,后面经过计算就会跳过NaN
有时候数据为0的时候 也要进行判断。因为有些0是有意义的,但还有一些0是人为添加的,这时候在计算的时候 就要变成NaN
问题
对于一组电影数据,如果我们想rating,runtime的分布情况,应该如何呈现数据?