pandas根据条件赋值

最新推荐文章于 2024-07-22 03:31:34 发布

elibneh

最新推荐文章于 2024-07-22 03:31:34 发布

阅读量8.3k

点赞数 2

分类专栏： pandas python 文章标签： python 数据挖掘数据分析

本文链接：https://blog.csdn.net/henbile/article/details/122673857

版权

pandas 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

python

6 篇文章 0 订阅

订阅专栏

常用条件：

多条件、是否相等、字符串是否包含、是否为nan等。

import pandas as pd
import numpy as np
df =pd.read_excel("/Users/name/Desktop/file.xlsx")
df['label'] = np.nan
# df['label'] = None

# 1. 判断值
df.loc[df['A'] == 'a', 'label'] = '1'

# 判断是否赋值成功，在赋值前后执行
# df[df.loc[:, 'A'] == 'a'].head(20)

# 2. 判断是否包含、以及多个条件的并行判断
df.loc[(df.loc[:, 'A'].str.contains("a"))  & (df.loc[:, 'B'].str.contains("b")), 'label'] = '2'

# 3. 判断是不是null

df.loc[pd.isnull(df.loc[:, 'label']), 'label'] = '3'

# 请注意后面的判断条件（优先级低的判断，不要覆盖优先级高的判断）

# 标签结果的分布统计
df.groupby(['label']).size()