Pandas条件查询与去重

最新推荐文章于 2024-07-17 10:37:21 发布

迷人的派大星

最新推荐文章于 2024-07-17 10:37:21 发布

阅读量1.1k

点赞数

分类专栏： pandas

本文链接：https://blog.csdn.net/airenKKK/article/details/104465352

版权

pandas 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

生成Pandas Dataframe，代码及输出结果如下：

import random
import pandas as pd

name_list = ['kim', 'kim', 'Amy', 'John', 'Amy', 'Bob']

result = []
for  i in range(len(name_list)):
    dt = {
        "name": name_list[i],
        "age": i + random.randint(1, 10),
        "weight": i * random.randint(1, 10)
    }
    result.append(dt)

df = pd.DataFrame(result)
print(df)

输出结果：
在这里插入图片描述
例如：查询 name=kim 且 age>5的数据：

print(df[(df.name == 'kim') & (df.age > 5)])

在这里插入图片描述
以name列去重：

df = pd.DataFrame(result).drop_duplicates(
        subset=['name'],  # 去重列，按这些列进行去重
        keep='first'  # 保存第一条重复数据
    )

print(df)

在这里插入图片描述
其中，subset可以多字段为参数，keep可选参数为‘first’， ‘last’，分别对应保留第一条和最后一条

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

迷人的派大星

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【python资料】pandas的条件查询

gongdiwudu的专栏

05-24

7498

在使用Pandas的DataFrame进行数据挖掘的时候，需要形形色色的条件查询，但是这些查询的基本语法是啥，查询的灵活性如何，本文将对他们进行详细列出，便于以后查阅。

python打卡记录去重_Pandas 数据筛选,去重结合group by

weixin_39983383的博客

12-17

864

Pandas 数据筛选,去重结合group by需求今小伙伴有一个Excel表, 是部门里的小伙9月份打卡记录, 关键字段如下:姓名, 工号, 日期, 打卡方式, 时间, 详细位置, IP地址....脱敏数据:姓名工号日期方式时间...小赵1232019-09-01GPS08:37:50....小赵1232019-09-01GPS18:10:50...小陈1242019-09-01GPS08:47...

参与评论您还未登录，请先登录后发表或查看评论

pandas 去重

bingheshidai_1234的博客

04-02

4243

'''处理我们重复得数据''' data=pd.DataFrame({'k1':['one','two']*3,'k2':[1,1,3,3,4,4]}) data['v1']=range(6) print(data) print(data.drop_duplicates(['k1','k2'],keep='last')) #保留后面的一条数据 ...

Pandas筛选、去重与数据合并

最新发布

书江南的博客

07-17

1518

通过本文操作，可以对表格进行排序和筛选，最终合并两张表格。groupby函数和merge函数是类似操作中最重要的部分，需要重点掌握。

第三章5节-Pandas运用之条件查询和增删改查

weixin_45441862的博客

10-24

216

条件查询【有多少个条件就有多少个中括号】增删改查首先区分一下axis = 0 和 axis = 1：增加两列数据删除某列的数据插入某列某个位置的数据删除某行的数据 ...

Pandas根据差值条件构造辅助列对几十万数据去重处理

weilangao的博客

04-04

505

最近碰到这样的一个问题：有一对数据t1列,t2列（如下图所示），用pandas读入，这些数据中会存在一个问题：①某一行的t1列值与另一行的t1列值相等，但t2列值的差值小于0.0001；②某一行的t2列值与另一行的t2列值相等，但t1列值的差值小于0.0001。我认为这两种情况是属于重合冗余情况（因为其他数据差别都大于0.0002），想要对数据进行去重，数据量有几十万条。一开始想要不...

【Python】进阶学习：pandas--如何根据指定条件筛选数据

创作高质量博文，分享知识，共同进步！

03-02

3588

🔥进阶Pandas技能！🔥掌握条件筛选，轻松筛选数据！🎯通过示例和技巧，让你快速上手pandas的条件筛选功能！📚从基础到高级，一步步带你掌握筛选技巧！💡同时，还有最佳实践指导，让你的代码更加清晰高效！🌈最后，别忘了保持学习的热情，与我们一起共同进步！🤝#pandas筛选技巧# #条件筛选# #Python进阶学习

Pandas中的数据去重与重复值处理

## 1.1 什么是数据去重与重复值处理数据去重是指在数据处理过程中，将数据集中重复的数据行进行删除或标记的操作。重复值处理是清洗数据的重要步骤，可以有效提高数据处理的准确性和结果的可信度。 ## 1.2 数据...

python pandas groupby去重条件列并且求和原标数据都在没有删除的函数记录

prefertea的博客

04-10

1672

import pandas as pd data = {"number":[1,1,np.nan,np.nan,2,2,1,2,2], "letter":['a','b',np.nan,np.nan,'c','d','b','c','d'], "label":[1,1,9,9,2,2,1,2,2],"label2":[33,12,9,9,2,2,1,2,2]} d...

pandas 索引去重_数据预处理实战（1）

weixin_33245447的博客

12-23

207

目录1. 前言2. 数据字典3. 优雅使用pandas3.1 读取数据3.2 索引与选取3.3 布尔索引3.4 去重3.5 分组3.6 数据框的合并(1)横向合并(2)纵向合并3.7 排序(ORDER )与替换(REPALCE)4. 衍生变量与数据编码4.1 apply函数4.2 map函数5. 数据描述6. 数据质量6.1 缺失值6.2 异常7. 数据分箱(离散化)1、前言数据挖掘的关键在于数据...

pandas多条件筛选

Viv_Bean的博客

07-20

4015

pandas大于等于&小于等于

Pandas多条件筛选

来自Daisy和她的单程车票

06-12

1271

pandas可以用str.contains来模糊筛选，有点像SQL中的like。filter不筛选具体的数据，而是筛选特定的行和列。regex：正则表达式。items：固定列名。

pandas条件复合筛选（多条件、与、或）

热门推荐

黄钢的博客

03-08

2万+

pandas条件复合筛选（多条件、与、或）数据分析工作中，Python第三方包pandas功能非常强大，其组合筛选功能比excel速度快很多。这里记录一下pandas的组合筛选功能。或筛选或筛选使用的符号是"|" 举个例子： import faker import pandas as pd # 生成假数据 fake = faker.Faker(locale='zh_CN') names = [] address = [] # province = [] city = [] job = [] for

Pandas中的五种数据查询方法--【数值，列表，区间，条件，函数查询】

qq_46044325的博客

09-11

1万+

这种错误一般都是修改完之后了，不能在进行修改，说明已经修改过了。2. df.iloc方法，根据行、列的数字位置查询。注意，组合条件&符号合并，每个条件判断都得带括号。1.df.loc方法，根据行、列的标签值查询。.loc既能查询，又能覆盖写入，强烈推荐!行或列，都可以只传入单个值，实现精确匹配。1.使用单个label值查询数据。注意：区间既包括开始，也包括结束。3.使用数值区间进行范围查询。北京2018年全年天气预报。2.使用值列表批量查询。4.使用条件表达式查询。得到DataFrame。

解决方案：Pandas如何多条件筛选数据

weixin_42504788的博客

04-19

455

解决方案：Pandas如何多条件筛选数据

整理了10个经典的Pandas数据查询案例（附原始数据\多个条件过滤\日期条件过滤）

Triumph19的博客

10-17

952

我希望在阅读本文后，您可以更频繁，流利地使用Pandas中的query()函数，因为它可以方便以过滤数据集。这些查询的函数我每天都会或多或少的使用。

Python：利用Pandas读取数据、查询指定条件的数据、以及数据的详细信息

无面人的博客

02-25

1万+

在Python中，如何利用Pandas去读取数据、查询指定条件的数据、以及获取数据的详细信息.

Pandas数据分析（数据定位，条件筛选，聚合）

KissyHuang的博客

03-04

1310

看到一篇写的很详细且系统的pandas数据分析博文，转载过来以备不时之需。主要包括：定位（loc, iloc, at, iat, ix），条件筛选（单条件和多条件筛选），去重（distinct），分组聚合（groupby，agg）等 ...

Pandas 数据操作详解：增删改查、去重与抽样

本文主要介绍了Pandas数据框的基础操作，包括增、删、改、查、去重和抽样等关键功能。通过实例演示了如何使用Pandas进行数据处理。在Pandas中，数据框（DataFrame）是一种常用的数据结构，用于存储二维表格型数据...