1. 删除dropna
DataFrame.dropna(self, axis=0, how=‘any’, thresh=None, subset=None, inplace=False)
axis :为轴方向 : 默认为axis=0
当axis=0,当某行出现缺失值时,将该行丢弃并返回
当axis=1,当某列出现缺失值时,将改列丢弃并返回
how :确定缺失值的个数:缺省时为how=‘any’
how=‘any’ ,表明只要某行或者列出现缺失值就将该行列丢弃
how=‘all’ ,表明某行列全部为缺失值才将其丢弃
thresh:阈值设定
当行列中非缺省值的数量少于给定的值就将该行丢弃
eg: thresh=2:当每行至少有2个不是空值时保留,全部为空时删除
subset:部分标签中删除某行列
subset = [ ‘a’,‘d’] 即丢弃子列 a d 中含有缺失值的行
eg:data.dropna(axis=0,subset=[“会员卡号”]) 删除会员卡号那列中含有缺失值的行
iniplace: bool取值,默认False
当inplace= True, 即对原数据操作,没有返回值
2.列表中某一列除以另一列(一一对应相除)
kdj_g[‘平均消费金额’] = list(map(lambda x,y: x/y, kdj_g[‘交易金额’],kdj_g[‘交易次数’]))