过滤掉出现次数少的行---pandaa.groupby

最新推荐文章于 2024-09-01 16:49:16 发布

Dawei_01

最新推荐文章于 2024-09-01 16:49:16 发布

阅读量5.5k

点赞数 7

分类专栏： ML python语法

本文链接：https://blog.csdn.net/Dawei_01/article/details/84863771

版权

需求：过滤掉pandas DataFrame中出现次数较少的行，可以采用下面的写法：df为待过滤数据

df_family_car = df.groupby("PLATE_INFO_EX").filter(lambda x: (len(x) > 500 and len(x)<1000))

详细研究groupby用法，参考链接：https://blog.csdn.net/songbinxu/article/details/79839363

https://blog.csdn.net/youngbit007/article/details/54288603/

新建数据：

import pandas as pd
df = pd.DataFrame({'key1':list('aabba'),
                  'key2': ['one','two','one','two','one'],
                  'data1': np.random.randn(5),
                  'data2': np.random.randn(5)})

df
Out[83]: 
  key1 key2     data1     data2
0    a  one -0.643930