1.空白的替换–填充
df[col].fillna('-1', inplace=True)
注意这里填充的是文本-1,而不是数字-1。在labelencoder里面因为是把文本硬编码,所以填充时需要用“-1”
如果没有inplace的话有时候可能填充不上,比如:
原始数据集缺失数量
填充之后发现还是有缺失值
不过,填上inplace=True就没问题了
另外如果针对某列进行填充(不写inplace),会返回一个list,把它pd.DataFrame后就可以在不改变原始数据集的情况下得到这一列填充后的pd,也许会有派的上用场的地方吧
2.有值,替换成另一个值
aumtrain4.loc[aumtrain4['C1']==-1, 'C1'] = 0
aumtrain4[‘C1’]==-1也可以用别的列来定位,不过我现在暂时就用它比较多