pandas.DataFrame.drop_duplicates

SmartDemo

已于 2023-02-16 10:39:31 修改

阅读量110

点赞数

分类专栏： Python 文章标签： pandas python Powered by 金山文档

于 2023-02-16 10:38:37 首次发布

本文链接：https://blog.csdn.net/SmartDemo/article/details/129056167

版权

Python 专栏收录该内容

31 篇文章 3 订阅

订阅专栏

一、用法

Return DataFrame with duplicate rows removed.
Considering certain columns is optional. Indexes, including time indexes are ignored.

二、代码实现

import pandas as pd
df = pd.DataFrame({'A':[1,2,2],'B':[3,3,1]})
df

df.drop_duplicates(keep='first')
# 对于‘A’，第二、三行重复，对于‘B’，第二、三行不重复 ==> 对于df，第二、三行不重复
# 对于‘B’，第一、二行重复，对于‘A’，第一、二行不重复 ==> 对于df，第一、二行不重复
# 对于df，第一、二、三行都不重复

df[['A']].drop_duplicates(keep='first')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SmartDemo

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python中Pandas.DataFrame简介及用法

Nikki0126的博客

08-15

1245

https://www.cnblogs.com/IvyWong/p/9203981.html https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_excel.html DataFrame是Python中Pandas库中的一种数据结构，它类似excel，是一种二维表。或许说它可能有点像matl...

pandas.DataFrame.drop_duplicates 用法介绍

09-16

主要介绍了pandas.DataFrame.drop_duplicates 用法介绍，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

参与评论您还未登录，请先登录后发表或查看评论

pandas.DataFrame.drop_duplicates 用法说明

weixin_30322405的博客

10-23

377

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False) subset考虑重复发生在哪一列，默认考虑所有列，就是在任何一列上出现重复都算作是重复数据 keep 包含三个参数first, last, False，first是指，保留搜索到的第一个重复数据，之后的都删除；last是指，保留搜索到的最后一个重复数据，之前的搜索...

pandas：去重函数 pandas.DataFrame.drop_duplicates

错位的梦寐的博客

10-30

872

- 1、官方文档： df.drop_duplicates? Signature: df.drop_duplicates(subset=None, keep='first', inplace=False) Docstring: Return DataFrame with duplicate rows removed, optionally only considering certain colum...

[Pandas] DataFrame.drop_duplicates() 删除重复值

Hudas的博客

02-14

5631

Pandas DataFrame.drop_duplicates() 删除重复值

Pandas 模块-操纵数据(8)-去除重复行 .drop_duplicates()

一分耕耘一分收获

12-09

4311

DataFrame.drop_duplicates(subset: 'Optional[Union[Hashable, Sequence[Hashable]]]' = None, keep: 'Union[str, bool]' = 'first', inplace: 'bool' = False, ignore_index: 'bool' = False)

详解pandas使用drop_duplicates去除DataFrame重复项参数

01-01

Pandas之drop_duplicates：去除重复项方法 DataFrame.drop_duplicates(subset=None, keep='first', inplace=False) 参数这个drop_duplicate方法是对DataFrame格式的数据，去除特定列下面的重复行。返回...

pandas.zip_pandas_pandas 速查手册_pandas开发手册

07-15

- **重复值处理**：`duplicated`检测重复行，`drop_duplicates`去除重复行。 5. **数据转换** - **数据类型转换**：`astype`函数可以将列转换为不同数据类型。 - **聚合操作**：`groupby`对数据进行分组，可以...

『Python - Pandas』drop_duplicates方法失效的探索及一种解决方法

m0_47149835的博客

12-03

2031

drop_duplicates 方法失效的原因以及相应解决方案

pandas进阶--Dataframe的drop_duplicates方法(数据去重)

qq_38727995的博客

04-28

1万+

本文介绍了实际处理数据是常用的数据去重方法，即Dataframe的drop_duplicates方法，包括drop_duplicates方法的具体介绍、以及传递不同函数时的使用用例。

pandas使用drop_duplicates去除DataFrame重复项参数详解

tomato_guo的博客

04-16

7万+

DataFrame中存在重复的行或者几行中某几列的值重复，这时候需要去掉重复行，示例如下： data.drop_duplicates(subset=['A','B'],keep='first',inplace=True) 代码中subset对应的值是列名，表示只考虑这两列，将这两列对应值相同的行进行去重。默认值为subset=None表示考虑所有列。 keep='first'表示保留第一次...

pandas小记：pandas数据规整化-缺失、冗余、替换

皮皮blog

09-22

1万+

http://blog.csdn.net/pipisorry/article/details/39482861 处理缺失数据缺失数据（missing data)在大部分数据分析应用中都很常见。pandas的设计目标之一就是让缺失数据的处理任务尽量轻松，pandas对象上的所有描述统计都排除了缺失数据。 pandas使用浮点NaN (Not a Number)表示浮点和非浮点数组中的缺失数据，...

【python】详解pandas dataframe 去重函数 pandas.DataFrame.drop_duplicates

brucewong0516的博客

04-18

3万+

- 1、首先直接看文档： df.drop_duplicates? Signature: df.drop_duplicates(subset=None, keep='first', inplace=False) Docstring: Return DataFrame with duplicate rows removed, optionally only considering certain...

python的drop_duplicates_Python pandas.DataFrame.drop_duplicates函数方法的使用

weixin_39944638的博客

12-11

565

DataFrame.drop_duplicates(self，subset = None，keep ='first'，inplace = False)返回删除了重复行的DataFrame，可选择仅考虑某些列。包括时间索引在内的索引将被忽略。参数：subset：列标签或标签序列，可选仅考虑用于标识重复项的某些列，默认情况下使用所有列keep：{'first'，'last'，False}，默认'...

pandas dataframe去除重复数据pandas.DataFrame.drop_duplicates

qq_27361945的博客

10-28

1711

例子： df2 = pd.DataFrame({'工参中没有的cgi': self.mismatchedcgis}) # subset='工参中没有的cgi' 表示只考虑列名为：工参中没有的cgi 这一列的重复项，不设则需考虑全部列，也可以设成多列 # inplace=True是直接在df2表中删除重复项，如果设成inplace=False则不修...

[pandas] DataFrame drop_duplicates() 删除重复行数据去重

weixin_43988131的博客

09-08

807

DataFrame drop_duplicates() 删除重复行 dfLancome = dfLancome.drop_duplicates()

Python对多属性的重复数据去重

data_heng

12-12

4万+

python中的pandas模块中对重复数据去重步骤： 1）利用DataFrame中的duplicated方法返回一个布尔型的Series,显示各行是否有重复行，没有重复行显示为FALSE，有重复行显示为TRUE； 2）再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。注释：如果duplicated方法和drop_dup

Pandas之drop_duplicates：去除重复项