快速从frame中提取出满足某列特征值的子frame函数
写在前面
有的时候我们需要经常从一个frame中提取子集,这个子集可能是frame中满足某列中某个值的子集。虽然这种提取子集的方法我们可以通过pandas中的条件索引和布尔索引实现,但如果需要重复多次提取子集,还是会比较麻烦的,所以我写了一个函数,其功能是快速返回一个frame中符合某列某值条件子frame。
def data_filter(data,colname,colvalue):
'''
接收一个dataframe,提取frame中满足某列中某值的frame子集,并返回这个frame子集
:data:一个dataframe数据结构
:colname:str类型,frame中某列的名称
:colvalue:object类型,colname列中的某一类特定的值,数据类型和colname中数据类型相同
'''
COLNAME = colname
COLVALUE = colvalue
filter_condition = 'data[COLNAME] == COLVALUE'
data_filter_ = data[eval(filter_condition)]
return data_filter_
函数演示
这里有一份面板数据,现在利用该函数直接提取其中2016年的截面数据。
函数的使用还是很简单的,不过要注意,函数中的colvalue参数类型要与所选colname列中值的类型相同,这一点要求在使用函数时需要自行判断colvalue的数据类型。