pandas-6重复值处理

pandas -6 重复值处理

如果你想找到或者删除 DataFrame中重复的行, 可以使用 duplicateddrop_duplicates

查找重复值

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
example:
col1 col2 c
0 one x -1.067137
1 one y 0.309500
2 two x -0.211056
3 two y -1.842023
4 two x -0.390820
5 three x -1.964475
6 four x 1.298329
In:
// 单列
df.duplicated("col1", keep="first")

// 多列
// df.duplicated(["col1", "col2"], keep="first")

Out:
0 False
1 True
2 False
3 True
4 True
5 False
6 False
dtype: bool

// 默认 keep = "first",第一次出现的不算重复,返回False
// keep = "last", 最后出现的不算重复
// keep = False, 重复值均返回 True

删除重复值

1
2
3
4
5
6
7
8
9
In:
df.drop_duplicates('col1')

Out:
col1 col2 c
0 one x -1.067137
2 two x -0.211056
5 three x -1.964475
6 four x 1.298329
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值