drop_duplicates

最新推荐文章于 2024-05-17 09:20:11 发布

happy_wealthy

最新推荐文章于 2024-05-17 09:20:11 发布

阅读量209

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/happy_wealthy/article/details/108515216

版权

python 专栏收录该内容

97 篇文章 8 订阅

订阅专栏

DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)

参数

subset：列标签，可选

keep： {‘first’, ‘last’, False}, 默认值 ‘first’

first：删除第一次出现的重复项。

last：删除重复项，除了最后一次出现。

False：删除所有重复项。

inplace：布尔值，默认为 False，是否删除重复项或返回副本

重复数据删除： DataFrame

示例：

import pandas as pd
data = pd.DataFrame({"A":["a","b","c","c"],"B":[1,1,2,2]})

data

	A	B
0	a	1
1	b	1
2	c	2
3	c	2

data.drop_duplicates(subset=None, keep="first", inplace=True)

data

	A	B
0	a	1
1	b	1
2	c	2

data.drop_duplicates(subset=["B"], keep="first", inplace=True)

subset=None 表示考虑所有列，将这所以列对应值相同的行进行去重。默认值 None。subset=[‘B’] 表示只考虑’B’这列，将 B 列对应值相同的行进行去重。
keep=’first’表示保留第一次出现的重复行，是默认值。keep 另外两个取值为 “last” 和 False，分别表示保留最后一次出现的重复行和去除所有重复行。
inplace=True 表示直接在原来的 DataFrame 上删除重复项，而默认值 False 表示生成一个副本。

happy_wealthy

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
drop_duplicates

DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)参数subset：列标签，可选keep： {‘first’, ‘last’, False}, 默认值 ‘first’first：删除第一次出现的重复项。last：删除重复项，除了最后一次出现。False：删除所有重复项。inplace：布尔值，默认为 False，是否删除重复项或返回副本返回重复数据删除： DataFrame示例：import
复制链接

扫一扫

专栏目录