pandas数据处理——根据条件新增/替换某一列值

以前又傻又菜的时候,根据条件替换某一列值或新增总是会写一些for 循环去处理,现在发现一个更简洁的方式,就是善用pandas方法。

根据条件新增一列值

现有数据集如下所示:

调用apply()方法,可以作用于 Series 或者整个 DataFrame,它自动遍历整个 Series 或者 DataFrame, 对每一个元素运行指定的函数。

新增一列label,要求按照id列是否包含M来指定label的取值:

#按条件新增一列
df['label']=df.id.apply(lambda x: 1 if 'M' in x else 0)
df

输出:

 

根据条件替换某一列值

数据集如下所示:

如果id列值包含‘L’,那么就将label列中对应的值从1替换成0:

df.loc[df['id'].str.contains('L'),'label']=0
df

输出:

 

  • 9
    点赞
  • 71
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值