python dataframe删除重复行_2.3.10 DataFrame 查看删除重复项

1.查看重复项 df.duplicated()

df.duplicated(subset=['python','java','C'],keep='first')

参数:subset 特定列有重复项才会显示True

keep:{ 'first', 'last', False}, default 'first'

# 默认 first 保留前一个数据,认为后面数据为重复的。  False 标记所有的都为重复的

具体如下:df = pd.DataFrame(data=np.random.randint(0,100,size=(10,4)),columns=['python','mysql','java','C'])

df.loc[1]=df.loc[5]  #设置重复项,第1和第5项相同

df.loc[2]=df.loc[4]

df.loc[6]=df.loc[9]

2.删除重复项

df.drop_duplicates(subset=['python','java','C'],keep='first')

等同于:df.drop(labels=df.loc[df.duplicated(subset=['python','java','C'],keep='last')].index)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值