◆ ◆ ◆ ◆ ◆
前言 数据缺失值的处理,在数据分析前期,即数据处理过程中占着重要的地位,在数据分析面试中被问到的概率也是极大的。 一般情况下,我们对待缺失值有三种处理方式: (1)源数据补录,即通过再次采样或者询问等方式将缺失内容补充完整; (2)缺失值填充,即根据一定的规则将缺失值填充,可选众数、中位数等; (3)删除缺失值,即根据一定的规则将含有缺失值的行或列直接进行删除。 我的会员请教了我关于缺失值的问题,于是我为他整理了一篇详细的文章,讲解一下如何进行缺失值处理。今天这篇文章只是缺失值处理的第一节—— 缺失值的删除 。 dropnadropna为pandas库下DataFrame的一个方法,用于删除缺失值。基本参数如下:
dropna(self, axis=0, how='any', subset=None, inplace=Fa