isin
和 notna
是 pandas 库中用于数据筛选和处理的两个常用方法。
isin
方法:
isin
方法用于检查一个序列中的每个元素是否包含在另一个序列中,返回一个布尔值的序列,指示每个元素是否在目标序列中。
import pandas as pd
# 创建一个示例数据框
data = {'A': [1, 2, 3, 4, 5],
'B': [5, 4, 3, 2, 1]}
df = pd.DataFrame(data)
# 使用isin方法筛选出'A'列中值为2或4的行
result = df['A'].isin([2, 4])
print(result)
输出:
0 False
1 True
2 False
3 True
4 False
Name: A, dtype: bool
在上面的示例中,df['A'].isin([2, 4])
返回一个布尔值的序列,表示’A’列中的每个元素是否在列表 [2, 4]
中。
notna
方法:
notna
方法用于检查一个序列中的每个元素是否不是缺失值(NaN),返回一个布尔值的序列。
import pandas as pd
# 创建一个示例数据框
data = {'A': [1, None, 3, None, 5]}
df = pd.DataFrame(data)
# 使用notna方法检查'A'列中的非缺失值
result = df['A'].notna()
print(result)
输出:
0 True
1 False
2 True
3 False
4 True
Name: A, dtype: bool
在上面的示例中,df['A'].notna()
返回一个布尔值的序列,表示’A’列中的每个元素是否不是缺失值。
这两个方法在数据处理和筛选时非常有用。isin
可以用于快速筛选包含特定值的行,而 notna
可以用于检查缺失值情况。