1、所在行内容是单一的或者是标量
df_fintech = df_text[df_text['业务一级分类']=="金融科技"]
2、所在行内容是割裂的
先转成str格式再用contains筛选。
df_fintech = df_text[df_text['业务一级分类'].str.contains("金融科技")]
3、筛选出列值属于某个范围内的行,用isin
df.loc[df['column_name'].isin(some_values)] # some_values是可迭代对象
4、多种条件限制时使用&,&的优先级高于>=或<=,所以要注意括号的使用
df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]
5、筛选出列值不等于某个/些值的行
利用反选的思想:
df.loc[df['column_name'] != 'some_value']
df.loc[~df['column_name'].isin('some_values')] #~取反 if values are str, remember to pass a list ['str1','str2']
参考引用
使用pandas筛选出指定列值所对应的行