知识点3:检查缺失值
import pandas as pd
data = pd.read_excel('C:/Users/dell-pc/Desktop/data.xlsx')
data.head(5)
data.shape[0]
data.isnull().sum()
知识点4:删除缺失值
data.dropna(how = "any", inplace = True)
data.head(5)
data.shape[0]
参数名称 | 参数用途 |
---|
how | 用于指定缺失值的删除方式,"any"表示只要存在一个缺失值就删除该行数据,"all"表示只有所有值均为缺失值才删除该行数据 |
inplace | 用于指定是否在原数据集上直接修改,"True"表示在原数据集上直接修改,"False"表示不在原数据集上直接修改 |
知识点5:填充缺失值
将缺失值填充为固定值
data.fillna(0, inplace = True)
data.head(5)
将某列的缺失值填充为固定值
data.fillna({"fixed acidity":0}, inplace = True)
data.head(5)
将缺失值填充为均值
data.fillna(data.mean(), inplace = True)
data.head(5)
将缺失值填充为中位数
data.fillna(data.median(), inplace = True)
data.head(5)
将某列的缺失值填充为均值
data["fixed acidity"] = data["fixed acidity"].fillna(data["fixed acidity"].mean())
data.head(5)
将某列的缺失值填充为中位数
data["fixed acidity"] = data["fixed acidity"].fillna(data["fixed acidity"].median())
data.head(5)
将缺失值填充为上一行的数据
data.fillna(method = "ffill", inplace = True)
data.head(5)
将缺失值填充为下一行的数据
data.fillna(method = "bfill", inplace = True)
data.head(5)
★微信搜一搜“TriHub数据社”,欢迎关注获得入社福利