r语言中unique_R语言第二章数据处理③删除重复数据

目录

R语言第二章数据处理③删除重复数据

================================================

这篇主要介绍如何在R中识别和删除重复数据。

主要用的到R base和dplyr函数:

duplicated():用于识别重复的元素和

unique():用于提取唯一元素,

distinct()[dplyr package]删除数据框中的重复行。

994f2d1a3002

x

duplicated(x)

## [1] FALSE TRUE FALSE FALSE FALSE TRUE FALSE

x[duplicated(x)]

## [1] 1 4

x[!duplicated(x)]

## 1, 1 2,4, 5, 6

根据某一列删除数据框中重复值

# Remove duplicates based on Sepal.Width columns

my_data[!duplicated(my_data$Sepal.Width), ]

## # A tibble: 23 x 5

## Sepal.Length Sepal.Width

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值