1 使用 isin()
方法检查列中是否包含在一组给定的值中
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e']
})
# 检查列'A'中是否包含值2或4
mask = df['A'].isin([2, 4])
print(mask)
'''输出将是一个布尔序列,表示每个元素是否在给定值中:
0 False
1 True
2 False
3 True
4 False
Name: A, dtype: bool
'''
2 使用 str.contains()
方法检查字符串列中是否包含特定的子字符串:
# 检查列'B'中是否包含子字符串'b'或'd'
# str.contains() 默认使用正则表达式,这里使用了 | 作为或操作符
# na=False 参数用于处理缺失值(如NaN),将其视为False
mask = df['B'].str.contains('b|d', na=False)
print(mask)
'''输出:
0 False
1 True
2 False
3 True
4 False
Name: B, dtype: bool
'''
3 如果只是想检查列中是否存在至少一个特定值,可以使用 any()
方法:
返回一个布尔值,表示是否存在至少一个True在布尔序列中
# 检查列'A'中是否存在至少一个2或4
exists = df['A'].isin([2, 4]).any()
print(exists) # 输出: True