【学习打卡】Pandas第六章:缺失数据


导入数据

import pandas as pd
import numpy as np
df = pd.read_csv('data/table_missing.csv')
df,head()

在这里插入图片描述

一、缺失观测及其类型

1.了解缺失信息

a. isna和notna方法-判断缺失值

判断Series是否为空:

df['Physics'].isna().head()
# 或者
df['Physics'].notna().head()

在这里插入图片描述
在这里插入图片描述
判断DataFrame缺失值:

df.isna().head()

在这里插入图片描述
判断DataFrame每一列有多少缺失值

df.isna().sum()

在这里插入图片描述
除此之外还可以用info函数查看缺失信息

df.info()

在这里插入图片描述

(b) 查看缺失值的所在行

以最后一列为例,挑出该列缺失值的行

df[df['Physics'].isna()]

在这里插入图片描述

(c) 挑出所有非缺失值列

使用all就是全部非缺失值,如果是any就是至少有一个不是缺失值。

df[df.notna().all(1)]

在这里插入图片描述

2.三种缺失符号

缺失符号 np.nan None np.NaT
类型 float64 Nonetype pandas._libs.tslibs.nattype.NaTType
equal的时候是否会包括在内 不包括 包括 不包括
某列出现该值的类型 1.数值型,布尔型统一转换为float64;2.字符型统一转换为O(object类型) 1.None传入数值型自动变换为np.nan;None传入时间型变量自动变换为np.NaT;2.None传入布尔类型,不改变原布尔列表;3.None传入字符型为NoneType 时间型变量类型不改变

二、缺失数据的运算与分组

1.加号与乘号规则

使用加法时,缺失值为0;
使用乘法时,缺失值为1;
使用累计函数时,缺失值自动略过。

2.groupby方法中的缺失值

df_g = pd.DataFrame
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值