Pandas 找出并查看数据中的重复行

最新推荐文章于 2024-07-12 19:06:42 发布

TianCMCC

最新推荐文章于 2024-07-12 19:06:42 发布

阅读量1.4w

点赞数 13

分类专栏：大数据分析师文章标签： python pandas

本文链接：https://blog.csdn.net/qq_36187610/article/details/121577539

版权

大数据分析师专栏收录该内容

3 篇文章 1 订阅

订阅专栏

示例：

df = pd.DataFrame({
    '用户编号': ['小明', '小明', '小王', '小美', '小张', '小王'],
    '统计日期': ['11.12', '11.12', '11.12', '11.12', '11.13'， '11.13'],
    '消费金额': [4, 3, 5, 10, 2, 5]
})

在这里插入图片描述

可见用户 “小明”，在11.12当日产生的消费金额不一致，因此判断为异常数据，将其找出：

dup_row = df.duplicated(subset=['用户编号', '统计日期'], keep=False)
df.insert(0, 'is_dup', dup_row)
df[df['is_dup'] == True]

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

TianCMCC

关注关注

13
点赞
踩
39

收藏

觉得还不错? 一键收藏
1
评论
Pandas 找出并查看数据中的重复行

dup_row = data.duplicated(subset=['用户编号', '统计日期'])data.insert(0, 'is_dup', dup_row)data[data['is_dup'] == True]
复制链接

扫一扫