pandas筛选出含有特定字符串的列
@author: Heisenberg
@date: 2022/11/08
df = df = pd.DataFrame(np.random.randn(-1,1,size=(5, 6)), columns=['A','B','C','A_col','B_col','C_col'])
# A B C A_col B_col C_col
#0 0 -1 -1 0 0 -1
#1 0 -1 -1 0 -1 0
#2 0 0 -1 -1 0 -1
#3 0 0 0 0 0 0
#4 0 -1 -1 -1 -1 0
df.loc[:,df.columns.str.contains('col')]
# A_col B_col C_col
#0 0 0 -1
#1 0 -1 0
#2 -1 0 -1
#3 0 0 0
#4 -1 -1 0
#在此基础上就可以做很多操作了,比如这些特征列或者行的和、列/行的均值等。
mean_col = df.loc[:,df.columns.str.contains('col')].mean(axis=0)
sum_col = df.loc[:,df.columns.str.contains('col')].sum(axis=0)