进行数据分析之前一般要对数据进行清洗,包括缺失值的处理、重复值的删除、数据转换等操作。
(1)查看缺失值有两种方式,一种是df.info(),输出值一般为每一列不是空值的个数,另一种是df.isnull().sum(),输出值为每一列空值的数量。
查看dataframe中多列数据需要双中括号,如下图:
(2)缺失值的处理方式有删除、替换等,df.dropna()函数会默认删除dataframe中所有带空值的行,df.fillna()函数会填充所有空值,也可以指定列。
进行数据分析之前一般要对数据进行清洗,包括缺失值的处理、重复值的删除、数据转换等操作。
(1)查看缺失值有两种方式,一种是df.info(),输出值一般为每一列不是空值的个数,另一种是df.isnull().sum(),输出值为每一列空值的数量。
查看dataframe中多列数据需要双中括号,如下图:
(2)缺失值的处理方式有删除、替换等,df.dropna()函数会默认删除dataframe中所有带空值的行,df.fillna()函数会填充所有空值,也可以指定列。