python:删掉重复行之drop_duplicates（）用法

最新推荐文章于 2025-02-07 21:01:36 发布

锂享生活

最新推荐文章于 2025-02-07 21:01:36 发布

阅读量1.2w

点赞数 17

分类专栏： python 文章标签： python 开发语言

本文链接：https://blog.csdn.net/m0_63227758/article/details/138992197

版权

drop_duplicates()是Pandas中一个非常实用的方法，用于从DataFrame或Series中删除重复的行或值，只保留第一次出现的记录。

它的基本语法如下：

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset：可选参数，指定考虑哪些列来判断重复，默认为所有列。你可以传入一列或多列的列名列表（作为字符串列表）来确定重复性。
keep：可选参数，决定如何处理重复项。
- 'first'（默认）：保留每个重复组中的第一个出现的行。
- 'last'：保留每个重复组中的最后一个出现的行。
- False：删除所有重复的行。
inplace：可选参数，如果设置为True，则直接在原DataFrame上进行修改，不返回新的Da