我们得到的数据通常并不是一开始就是我们想要的,这时候我们需要对数据进行清洗,以期望最后以我们所要的方式呈现出来,并且便于后面的分析与建模。
上一篇:数据分析入门一
缺失值观察与处理
我们得到的数据中往往可能会有一些缺失值,这个缺失值如果不进行处理的话,会对我们后面的分析造成很大影响。
缺失值观察
一般我们可以用两种方法对缺失值进行观察,如下:
缺失值处理
对于缺失值我们可以将它舍去,有dropna()方法。我们也可以用其他的值进行填充,有fillna()方法。
关于这两个方法如何运用,我们在jupyter中将光标移动到方法处,按Shift+Tab键即可显示。
还可以去参考官网: