如何在 Pandas DataFrame 列中搜索值?

在 DataFrame 列中搜索值的 Python Pandas 代码示例

在任何机器学习或数据科学项目中处理大型数据集时,都需要在特征中搜索某些值,而对于这些值,我们需要从其他特征中获取值。在数据集中搜索值可能听起来很复杂,但 Python Pandas 让它变得简单。

下面的 Python Pandas 代码执行以下操作:

1. 创建数据字典并将其转换为 Dataframe

2. 使用“where”函数过滤出所需的数据列。pandas.DataFrame.where() 函数类似于 if-then 惯用语,它检查条件以相应地返回结果。

用于在 DataFrame 中查找值的 Python Pandas 示例代码

下面是 python 中的 pandas 代码,用于在 Pandas DataFrame 列中搜索值 -

第 1 步 - 导入库

import pandas as pd

我们只导入了此代码示例所需的 python pandas 库。

第 2 步 - 设置数据

我们已经创建了一个数据字典并将其传递给 pd.DataFrame 以创建一个包含“first_name”、“last_name”、“age”、“Comedy_Score”和“Rating_Score”列的数据框。

raw_data = {'first_name': ['Sheldon', 'Raj', 'Leonard', 'Howard', 'Amy'],
            'last_name': ['Copper', 'Koothrappali', 'Hofstadter', 'Wolowitz', 'Fowler'],
            'age': [42, 38, 36, 41, 35],
            'Comedy_Score': [9, 7, 8, 8, 5],
            'Rating_Score': [25, 25, 49, 62, 70]}

df = pd.DataFrame(raw_data, columns = ['first_name', 'last_name', 'age',
                                       'Comedy_Score', 'Rating_Score'])
print(df)

第 3 步 - 在 DataFrame 中搜索值

我们在特征 Rating_Score 中搜索值小于 50 的数据,对于这些值,我们在 comedy_Score 中选择相应的值。

print(df['Comedy_Score'].where(df['Rating_Score'] < 50))

输出如下所示 -

first_name last_name age Comedy_Score Rating_Score

0 Sheldon Copper 42 9 25

1 Raj Koothrappali 38 7 25

2 Leonard Hofstadter 36 8 49

3 Howard Wolowitz 41 8 62

4 Amy Fowler 35 5 70

0 9.0

1 7.0

2 8.0

3 NaN

4 NaN

Name: Comedy_Score, dtype: float64

  • 6
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 14
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Sonhhxg_柒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值