任务描述
本关任务:根据所学知识完成右侧选择题。
相关知识
本关卡主要介绍Pandas
自带的几个处理缺失值的工具的用法,该系列Pandas
实训的缺失值主要有三种形式:null
、NaN
或NA
。
选择处理缺失值的方法
一般情况下可以分为两种:一种方法是通过一个覆盖全局的掩码表示缺失值,另一种方法是用一个**标签值(sentinel value)
**表示缺失值。
-
掩码方法中掩码可能是一个与原数组维度相同的完整布尔类型数组,也可能是用一个比特(
0
或1
)表示有缺失值的局部状态; -
标签方法中,标签值可能是具体的数据(例如用
-9999
表示缺失的整数),也可能是些极少出现的形式。
Pandas缺失值
综合考虑各种方法的优缺点,Pandas
最终选择用标签方法表示缺失值,包括两种Python
原有的缺失值:浮点数据类型的NaN
值,以及 Python
的None
对象。
-
None
:Python
对象类型的缺失值Pandas
可以使用的第一种缺失值标签是None
,它是一个Python
单体对象,由于