关于一些DataFrame的一些异常数据检查 笔记

刚刚开始学习机器学习,学了很短时间的pandas,使用一些api不熟练,经常忘记。

     很菜,所以来记一下笔记,加深印象,方便日后查找(百度了太多才找到我想要的。。。。懒得搜了以后)。

 

  ----删除异常数据行

 datas = df.replace('?', np.nan).dropna(how = 'any') # 所有的’?‘替换为nan,之后只要有列为空,就进行删除操作

-----查询某列为指定数的行  

res_df = df.query('UNIT_ID == "10102"')                    #查找UNIT_ID列中值为“10102”的所有行 

------查找UNIT_ID列中值为“10102”并且GA_ID列中值为“910”的所有行

df.query('UNIT_ID == "10102"').query('GA_ID == "910"')

-----查询某列数据值的数量

df['Bare Nuclei'].value_counts()

------判断是否有缺失值

df.isnull()​​​​​​​ 

-----判断哪些列存在缺失值
df.isnull().any()
-----只显示存在缺失值的行
df[df.isnull().values==True]

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值