pandas根据条件赋值

常用条件:

多条件、是否相等、字符串是否包含、是否为nan等。

import pandas as pd
import numpy as np
df =pd.read_excel("/Users/name/Desktop/file.xlsx")
df['label'] = np.nan
# df['label'] = None

# 1. 判断值
df.loc[df['A'] == 'a', 'label'] = '1'

# 判断是否赋值成功,在赋值前后执行
# df[df.loc[:, 'A'] == 'a'].head(20)

# 2. 判断是否包含、以及多个条件的并行判断
df.loc[(df.loc[:, 'A'].str.contains("a"))  & (df.loc[:, 'B'].str.contains("b")), 'label'] = '2'

# 3. 判断是不是null

df.loc[pd.isnull(df.loc[:, 'label']), 'label'] = '3'

# 请注意后面的判断条件(优先级低的判断,不要覆盖优先级高的判断)

# 标签结果的分布统计
df.groupby(['label']).size()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值