python中对于重复出现的记录，标记其第一次出现，中间出现，最后一次出现

最新推荐文章于 2022-12-09 11:01:34 发布

tianren9

最新推荐文章于 2022-12-09 11:01:34 发布

阅读量4.5k

点赞数 1

本文链接：https://blog.csdn.net/u010589524/article/details/82887532

版权

import numpy as np
import pandas as pd 
#标记DataFrame重复例子
df = pd.DataFrame({'col1': ['one', 'one', 'two', 'two', 'two', 'three', 'four'], 'col2': [1, 2, 1, 2, 1, 1, 1],
                   'col3':['AA','BB','CC','DD','EE','FF','GG']},index=['a', 'a', 'b', 'c', 'b', 'a','c'])
#duplicated(self, subset=None, keep='first')
#根据列名标记
#keep='first'
df.duplicated()#默认所有列，无重复记录
df.duplicated('col1')#第二、四、五行被标记为重复
df.duplicated(['col1','col2'])#第五行被标记为重复

优惠劵

tianren9

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
python中对于重复出现的记录，标记其第一次出现，中间出现，最后一次出现

import numpy as npimport pandas as pd #标记DataFrame重复例子df = pd.DataFrame({'col1': ['one', 'one', 'two', 'two', 'two', 'three', 'four'], 'col2': [1, 2, 1, 2, 1, 1, 1], 'col3':['AA'...
复制链接

扫一扫