假设我有以下pandas DataFrame:
A B C
0 0.548814 0.791725 0.978618
1 0.715189 0.528895 0.799159
2 0.602763 0.568045 0.461479
3 0.544883 0.925597 0.780529
4 0.423655 0.071036 0.118274
5 0.645894 0.087129 0.639921
6 0.437587 0.020218 0.143353
7 0.891773 0.832620 0.944669
8 0.963663 0.778157 0.521848
9 0.383442 0.870012 0.414662
可以使用以下代码创建:
import pandas as pd
import numpy as np
size = 10
np.random.seed(0)
keys = ["A", "B", "C"]
df = pd.DataFrame({k: np.random.random(size) for k in keys})
如何找到符合给定条件的第一列?
在这种情况下,假设我的标准是我想要第一列,其中值小于某个p,比如0.5.如果没有列符合此条件,我想返回“不匹配”.
使用apply,这可以做到如下:
p = 0.5
first = df.apply(
lambda row: next((x for i, x in enumerate(df.columns) if row[x]
axis