python3删除数据重复值，只保留第一项。drop_duplicates（）函数使用介绍

最新推荐文章于 2024-06-27 16:41:53 发布

我的小号1111

最新推荐文章于 2024-06-27 16:41:53 发布

阅读量1w

点赞数 2

分类专栏： pyhon pandas 文章标签： python pandas drop_duplicates()

本文链接：https://blog.csdn.net/weixin_42199636/article/details/82949439

版权

pyhon 同时被 2 个专栏收录

11 篇文章 1 订阅

订阅专栏

pandas

8 篇文章 1 订阅

订阅专栏

原始数据如下：

f 列的前3个数据都有重复项，现在要将重复值删去，只保留第一项或最后一项。

使用drop_duplicates（）

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重复值全部被删除

keep:保留第一个值，参数为first,last

inplace:是否替换原来的df,默认为False

import pandas as pd

data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g'])  
#读取文件数据，并将列命名为abcdef

data.drop_duplicates(subset='f', keep='first', inplace=True)

print(data)

结果：