python去重pandas_pandas中的数据去重处理的实现方法

最新推荐文章于 2023-11-24 09:57:19 发布

weixin_39779467

最新推荐文章于 2023-11-24 09:57:19 发布

阅读量1.1k

点赞数

文章标签： python去重pandas

数据去重可以使用duplicated()和drop_duplicates()两个方法。

DataFrame.duplicated(subset = None，keep =‘first' )返回boolean Series表示重复行

参数：

subset：列标签或标签序列，可选

仅考虑用于标识重复项的某些列，默认情况下使用所有列

keep：{‘first'，‘last'，False}，默认'first'

first：标记重复，True除了第一次出现。

last：标记重复，True除了最后一次出现。

错误：将所有重复项标记为True。

import numpy as np

import pandas as pd

from pandas import Series, DataFrame

df = pd.read_csv('./demo_duplicate.csv')

print(df)

print(df['Seqno'].unique()) # [0. 1.]

# 使用duplicated 查看重复值

# 参数 keep 可以标记重复值 {'first'，'last'，False}

print(df['Seqno'].duplicated())

'''

0 False

1 True

2 True

3 True

4 False

Name: Seqno, dtype: bool

'''

# 删除 series 重复数据

print(df['Seqno'].drop_duplicates())

'''

0 0.0

4 1.0

Name: Seqno, dtype: float64

'''

# 删除 dataframe 重复数据

print(df.drop_duplicates(['Seqno'])) # 按照 Seqno 来去重

'''

Price Seqno Symbol time

0 1623.0 0.0 APPL 1473411962

4 1649.0 1.0 APPL 1473411963

'''

# drop_dujplicates() 第二个参数 keep 包含的值有： first、last、False

print(df.drop_duplicates(['Seqno'], keep='last')) # 保存最后一个

'''

Price Seqno Symbol time

3 1623.0 0.0 APPL 1473411963

4 1649.0 1.0 APPL 1473411963

'''

pandas 去除重复行

DataFrame.drop_duplicates(subset = None，keep ='first'，inplace = False )

subset ：指定列，默认情况下使用所有列

keep ： {'first'，'last'，False}，默认'first'

first ：删除重复项保留第一次出现的。last ：删除重复项保留最后一次出现的。false：删除所有重复项。

inplace ：布尔值，默认为False 是否删除重复项或返回副本

栗子：

到此这篇关于pandas中的数据去重处理的实现方法的文章就介绍到这了,更多相关Pandas 数据去重内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

weixin_39779467

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python去重pandas_pandas中的数据去重处理的实现方法

数据去重可以使用duplicated()和drop_duplicates()两个方法。DataFrame.duplicated(subset = None，keep =‘first' )返回boolean Series表示重复行参数：subset：列标签或标签序列，可选仅考虑用于标识重复项的某些列，默认情况下使用所有列keep：{‘first'，‘last'，False}，默认'first'fir...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。