1 介绍
isin()
是pandas中一个用于筛选数据的函数,它接受一个可迭代对象作为参数,并返回一个布尔值序列,表示数据是否匹配给定的条件。
以下是isin()
函数的基本语法:
df[column_name].isin(iterable)
df[column_name]
表示要应用函数的列名或Series。iterable
是包含要检查的值的可迭代对象,如列表、元组、集合等。
isin()
函数会遍历列中的每一个值,并检查它是否存在于iterable
中。如果存在,则返回True,否则返回False。
以下是一个使用isin()
函数的示例:
2 示例
import pandas as pd
# 创建一个示例DataFrame
data = {'邮路代码': ['110', '120', '130', '110', '120'],
'姓名': ['Alice', 'Bob', 'Charlie', 'David', 'Elena'],
'年龄': [25, 28, 24, 30, 22],
'城市': ['北京', '上海', '广州', '成都', '深圳']}
df = pd.DataFrame(data)
# 使用isin()筛选邮路代码为'110'和'120'的行
filtered_df = df[df['邮路代码'].isin(['110', '120'])]
# 打印筛选后的DataFrame
print(filtered_df)
在上述代码中,我们创建了一个示例DataFrame,其中包含邮路代码、姓名、年龄和城市等列。然后,使用df['邮路代码'].isin(['110', '120'])
来检查邮路代码是否为’110’或’120’,返回一个布尔值序列。最后,我们将该序列应用于DataFrame的索引中,以筛选出满足条件的行,并将结果保存在一个新的DataFrame中。最后,打印筛选后的DataFrame,即包含邮路代码为’110’和’120’的行的DataFrame。