第七章 缺失数据
一、缺失值的统计和删除
1. 缺失信息的统计
df = pd.read_csv('../data/learn_pandas.csv', usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight', 'Transfer'])
df.isna().head()
取出需要的几列,output:
查看比例有时更有用,而不是单单地只看哪些数值是缺失值!!!
缺失数据可以使用isna或isnull(两个函数没有区别)来查看每个单元格是否缺失,结合mean可以计算出每列缺失值的比例:
df.isna().mean() # 查看缺失的比例
output: