pandas 统计某列的值出现的次数，并删除出现一次的值

最新推荐文章于 2024-08-02 13:35:36 发布

WGS.

最新推荐文章于 2024-08-02 13:35:36 发布

阅读量4.4k

点赞数 8

分类专栏： # python

本文链接：https://blog.csdn.net/qq_42363032/article/details/117251494

版权

python 专栏收录该内容

82 篇文章 5 订阅

订阅专栏

删除ad_position_id这一列，出现一次的值，把出现一次的ad_position_id放到一个列表，删除

train_flle_path = 'data/pre_data3.csv'
source_data = pd.read_csv(train_flle_path)
print(len(source_data))

d = pd.DataFrame(source_data.ad_position_id.value_counts())
d.columns = ['nums']

# 出现一次的全部删除
d = d[d['nums'] == 1]
delindexs = d.index
print(len(delindexs))

source_data = source_data[~source_data['ad_position_id'].isin(delindexs)]

print(len(source_data))