目录
numpy库中的mean()函数
求平均值
pandas填充缺失值
data[“age”].fillna(data[‘age’].mean()) 把age为缺失值的填充上平均值
dropna()删除缺失行
data.dropna() 删除掉那些 有缺失值的行
info()
data.info()展示信息
head() 展示
data.head(n)默认值为5
Pandas中的unique()
unique()方法返回的是去重之后的不同值
numpy tolist()的用法
数组转成list
lambda 函数是一种小的匿名函数
将此列中的所有值替换为下标索引
astype
data[‘sex’]‘male’ 遍历每一行 若为male 则为true 否则false
(data[‘sex’]‘male’ )astype(‘int’) 变成01
loc和iloc
data.loc[:,[‘A’]] #取’A’列所有行,多取几列格式为 data.loc[:,[‘A’,‘B’]]
data.iloc[:,[0]] #取第0列所有行,多取几列格式为 data.iloc[:,[0,1]]