python出现次数删除行_Python Pandas：根据出现的次数删除条目

最新推荐文章于 2022-01-06 14:24:26 发布

weixin_39522423

最新推荐文章于 2022-01-06 14:24:26 发布

阅读量564

点赞数

文章标签： python出现次数删除行

本文链接：https://blog.csdn.net/weixin_39522423/article/details/111853537

版权

I'm trying to remove entries from a data frame which occur less than 100 times.

The data frame data looks like this:

pid tag

1 23

1 45

1 62

2 24

2 45

3 34

3 25

3 62

Now I count the number of tag occurrences like this:

bytag = data.groupby('tag').aggregate(np.count_nonzero)

But then I can't figure out how to remove those entries which have low count...

解决方案

Edit: Thanks to @WesMcKinney for showing this much more direct way:

data[data.groupby('tag').pid.transform(len) > 1]

import pandas

import numpy as np

data = pandas.DataFrame(

{'pid' : [1,1,1,2,2,3,3,3],

'tag' : [23,45,62,24,45,34,25,62],

})

bytag = data.groupby('tag').aggregate(np.count_nonzero)

tags = bytag[bytag.pid >= 2].index

print(data[data['tag'].isin(tags)])

yields

pid tag

1 1 45

2 1 62

4 2 45

7 3 62

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39522423

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python：pandas计算各项出现次数，并输出各行数据

ywzgq的博客

03-24

9605

今天在工作中遇到一个需求：有一个ABC三列的表，其中A列数据大量重复，且BC列不同。现在需要根据A列的数据，汇总A列去重并输出重复次数最多的100行（N行）原始表类似于这样： A B C FFFEFFFEFFF 71956 1 FFFF7FFF7FF 28994 2 DFF4DFF4DFF 68109 3 1FF807F800...

python dataframe增加一行_python - 在pandas.DataFrame中添加一行

weixin_39880490的博客

12-04

1万+

python - 在pandas.DataFrame中添加一行据我所知，pandas旨在加载完全填充的DataFrame，但我需要创建一个空的DataFrame，然后逐个添加行。做这个的最好方式是什么？我成功创建了一个空的DataFrame：res = DataFrame(columns=('lib', 'qty1', 'qty2'))然后我可以添加一个新行并填充一个字段：res = res....

参与评论您还未登录，请先登录后发表或查看评论

重复行(或重复词语)删除程序 (Python 代码)

06-03

可以删除文档中重复的内容，只要是一行一行的，包括词表中重复的词、术语、词组或短语等，以及文章中重复的词、词组、短语、句子、段落等。在 .txt 中操作。

python出现次数删除行,Python Pandas：根据出现的次数删除条目

weixin_39859128的博客

12-22

384

I'm trying to remove entries from a data frame which occur less than 100 times.The data frame data looks like this:pid tag1 231 451 622 242 453 343 253 62Now I count ...

python出现次数删除行_Python /集合-删除出现次数相同的元素

weixin_39640195的博客

12-22

172

范例1：import collectionslist = ['Mike', 'Mike', 'Mike', 'Jhon', 'Jhon', 'Rob', 'Rob', 'Carl', 'Carl']list_counter = collections.Counter(list)>> Counter({'Mike': 3, 'Rob': 2, 'Jhon': 2, 'Carl': 2})...

python出现次数删除行_python计算一个字符串在pandas datafram的整行中出现的次数

weixin_39620578的博客

12-22

222

使用前面的question中的代码，我们简单地将any方法更改为sum方法。将所有的1相加，以有效地计算给定行(轴=1)中出现的次数。在## added and extra Jones into row 1 for 'Jan' columnsales = [{'account': 'Jones LLC', 'Jan': 'Jones', 'Feb': '200', 'Mar': '140'},{'...

pandas 统计某列的值出现的次数，并删除出现一次的值

WGS.

05-25

4471

删除ad_position_id这一列，出现一次的值，把出现一次的ad_position_id放到一个列表，删除 train_flle_path = 'data/pre_data3.csv' source_data = pd.read_csv(train_flle_path) print(len(source_data)) d = pd.DataFrame(source_data.ad_position_id.value_counts()) d.columns = ['nums'] # 出现一次的全部删

AP_Python_Programs:我决定分享一些代码，由我用Python语言编写

03-17

在压缩包的文件名称列表中，我们只有一个条目："AP_Python_Programs-master"。通常，"master"是Git仓库的主分支名，这可能意味着这是一个公开的GitHub项目。因此，我们可以期待在这个目录下找到一个结构化的项目，...

python pandas 条件求和_python 使用pandas计算累积求和的方法

weixin_39875031的博客

12-08

3785

python 使用pandas计算累积求和的方法使用pandas下的cumsum函数cumsum：计算轴向元素累积加和,返回由中间结果组成的数组.重点就是返回值是"由中间结果组成的数组"import numpy as np'''arr是一个2*2*3三维矩阵，索引值为0，1，2cumsum(0)：实现0轴上的累加：以最外面的数组元素为单位，以[[1,2,3],[8,9,12]]为开始实现后面元素的...

python中统计各个单词出现的次数使用方法_python统计文本中每个单词出现的次数...

weixin_39827728的博客

11-24

4861

.python统计文本中每个单词出现的次数：#coding=utf-8__author__ = 'zcg'import collectionsimport oswith open('abc.txt') as file1:#打开文本文件str1=file1.read().split(' ')#将文章按照空格划分开print "原文本:\n %s"% str1print "\n各单词出现的次数：\n ...

pandas统计数据项重复值次数和删除

qq_35690171的博客

12-25

3180

import numpy as np import pandas as pd # 原始数据 df = pd.DataFrame({'key1':['a','a','b','b','a','a'], 'key2':['one','one','one','two','one','one'], 'data1':[1,1,2,2,3,3],...

将DataFrame中出现过一次的行进行删除；两个DataFrame求交集、求差

m0_51099057的博客

01-06

2155

import pandas as pd # 导入包 data = pd.DataFrame({ 'a':[1,1,3,5], 'b':[1,2,3,4], 'c':[1, 3, 5, 6] }) #创建一个表 a = list(data["a"].value_counts()) # 获取a列不同数值出现的个数 b = list(data["a"].value_counts().index) # 获取出现个数的具体数 y = [] f.

pandas数据预处理------去除‘记录重复’的3种方法

ThinkPet

09-28

7397

常见的数据重复包括： 1.记录重复--一个或多个特征的某条记录的值完全相同 2.特征重复--存在一个或者多个特征名称不同，但数据完全相同的情况去除‘记录重复’的3种方法 # coding: utf-8 # 去除‘记录重复’的3种方法 # 法1---利用list去重 import pandas as pd detail=pd.read_csv(r'D:\save\detail.c...

python小于_删除python中小于某个值的行

weixin_39812577的博客

11-30

2477

我觉得这个问题以前一定是有人回答的,但我找不到堆栈溢出的答案！我有一个看起来像这样的数据帧结果,我想删除所有小于或等于10的值>>> resultName Value Date189 Sall 19.0 11/14/15191 Sam ...

pandas 小技巧——如何删除行或者列、根据条件删除指定行或者列