pandas-6重复值处理

最新推荐文章于 2024-02-27 15:05:39 发布

elgong

最新推荐文章于 2024-02-27 15:05:39 发布

阅读量98

点赞数

本文链接：https://blog.csdn.net/elgong/article/details/106613193

版权

pandas -6 重复值处理

如果你想找到或者删除 DataFrame中重复的行, 可以使用 duplicated 和 drop_duplicates

查找重复值

example:
        col1  col2     c
    0    one   x   -1.067137
    1    one   y    0.309500
    2    two   x   -0.211056
    3    two   y   -1.842023
    4    two   x   -0.390820
    5  three   x   -1.964475
    6   four   x    1.298329
In:
    // 单列
    df.duplicated("col1", keep="first")
    
    // 多列
    // df.duplicated(["col1", "col2"], keep="first")
    
Out:
    0    False
    1     True
    2    False
    3     True
    4     True
    5    False
    6    False
    dtype: bool
    
    // 默认 keep = "first",第一次出现的不算重复，返回False
    // keep = "last", 最后出现的不算重复
    // keep = False, 重复值均返回 True

删除重复值

In:
    df.drop_duplicates('col1')
    
Out:
        col1  col2    c
    0    one   x    -1.067137
    2    two   x    -0.211056
    5  three   x    -1.964475
    6   four   x     1.298329

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

elgong

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas-6重复值处理

pandas -6 重复值处理如果你想找到或者删除 DataFrame中重复的行, 可以使用 duplicated 和 drop_duplicates查找重复值1234567891011121314151617181920212223242526272829example: col1 col2 c ...
复制链接

扫一扫