pandas填补缺失值的方法
在处理数据的过程中,经常会遇到原数据部分内容的缺失,为了保证我们最终数据统计结果的正确性,通常我们有两种处理方式,第一种就是删除掉这些部分缺失的数据;第二种就是填补这些缺失的数据。接下来,我们主要介绍填补缺失值的方法。
填充法
咱们所用到的数据:
import pandas as pd
import numpy as np
planets = pd.read_csv('planets.csv')
print(planets.head(10))
print(planets.notnull().nunique())#这里用来判断数据中是否存在为空,并且那些列存在为空的值
planets.fillna(value={'distance':planets['distance'].mean(),'mass':0,'orbital_period':0},inplace=True)
print("===============填充完毕=================")
print(planets.notnull().nunique())
好了,咱们先看一下运行结果