s3 sdk c++ 删除_48R软件数据的基本处理之删除重复数据(duplicated()、unique()、distinct()函数)...

大家好,之前有分享过添加新的行,俗话说有加就有减,因此这次分享的将是删除数据。之前有讲过通过索引进行删除数据,这次要分享的是删除重复数据,这也是数据预处理中很常用的一种处理要求。

删除重复数据的方式就多种,常见的是以下三种方式:

1,duplicated()函数

duplicated()函数能够确定向量或数据框中的重复元素,返回值为指出哪个或哪行是重复的逻辑型向量。

其完整形式为:duplicated(x, incomparables = FALSE, ...)。

其中,参数x可为向量、数据框、数组或NULL。

1fb1bba8ea68fd38b2e7eb42891633c0.png

其中,向量a中第五个元素开始是重复的,因此后面几个元素返回值都为TRUE。数据框B中,第四行和第五行是和前面内容重复的,因此返回值的第四个第五个元素为TRUE。

参数incomparables指定的是不能进行比较的值形成的向量,默认取值为FALSE:

e2baa7d85f0d2fa1e854a1d9e8b4b89f.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值