问题:如何提取出一个df矩阵中所有满足于某一条件的行和列名
c d e
a 0 1 2
b 3 4 5
比如说像这个df,筛选出所有值小于等于3的行列名
我想要【行列对】,就是(a,c)(a,d)这样子
一、用numpy解决
# pandas.dataframe中根据条件获取元素所在的位置(索引)
import numpy as np
import pandas as pd
df = pd.DataFrame({'c':[0,3],'d':[1,4],'e':[2,5]},index=['a','b'])
df
c | d | e | |
---|---|---|---|
a | 0 | 1 | 2 |
b | 3 | 4 | 5 |
# 把dataframe转化成array
df_a=df.values
df_a
array([[0, 1, 2],
[3, 4, 5]], dtype=int64)
# numpy中实现ndarray数组返回符合特定条件的索引方法
arr_loc =np.argwhere(df_a<=3)
arr_loc
array([[0, 0],
[0, 1],
[0, 2],
[1, 0]], dtype=int64)
# 打印出原表的行列名
for i in ary_loc:
print (df.index[i[0]],df.columns[i[1]])
a c
a d
a e
b c
# 解法 2 :
[(df.index[i],df.columns[j])for i,j in arr_loc]
# 解法3:
list(zip(df.index[ary_loc[:,0]],df.columns[ary_loc[:,1]]))
二、pandas 如何做呢?
df.where(df<=3).stack().index
MultiIndex([('a', 'c'),
('a', 'd'),
('a', 'e'),
('b', 'c')],
)