当我们使用pandas处理缺失值时,常常会用到众数填充,例如
df.fillna(df['column'].mode(), inplace=True)
但有时候某列待处理的数据中的缺失值数量最多,此时调用众数函数,得到的众数是缺失值还是非缺失值呢?
在下面的例子中用tracks表来演示这个问题
tracks_mean=tracks.copy()
tracks_mean1=tracks.copy()
tracks_mean.isnull().sum()
查看tracks_mean的原始内容,发现Composer中有978个空值
我们把Composer为空的行去掉,再以Composer列为准,统计一个众数
, 得到如下结果1:
当我们不删除有空缺值的行,直接统计众数,得到如下结果2:
结果1和结果2相同.
由此我们得出结论,调用pandas的mode()统计众数时,系统不会考虑空缺值