R语言去重复数据

原创 2016年08月30日 14:46:25

本次总结来源网络,有多处参考

在R语言中,去掉重复数据的函数是:duplicated

删掉所有列中数据一样的:

>test <- data.frame(
  x1 = c(1,2,3,4,5,1,3,5),
  x2 = c("a","b","c","d","e","a","b","e"),
  x3 = c("a","b","c","d","e","a","c","e"))
> test
  x1 x2 x3
1  1  a  a
2  2  b  b
3  3  c  c
4  4  d  d
5  5  e  e
6  1  a  a
7  3  b  c
8  5  e  e

> test[!duplicated(test),] #删掉所有列上都重复的
  x1 x2 x3
1  1  a  a
2  2  b  b
3  3  c  c
4  4  d  d
5  5  e  e
7  3  b  c

选择性的删除重复的

> test[!duplicated(test[,c(2,3)]),]
  x1 x2 x3
1  1  a  a
2  2  b  b
3  3  c  c
4  4  d  d
5  5  e  e
7  3  b  c
版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

R语言︱数据去重

笔者寄语:unique对于一个向量管用,对于matrix、data frame那些就不管用了。(谢益辉) 查看重复的方式,有点像分类变量个数一样,unique()  或者 table()  都是很好...

R语言数据去重

R语言常用的去重命令有unique duplicated unique主要是返回一个把重复元素或行给删除的向量、数据框或数组 > x > x  [1]  3  4  5 11 10  9  8  ...

R 语言去除重复的数据

如下为测试命令 > q > unique(q) [1]  1  2  3  5 53 > mode(q) [1] "numeric" 上面的例子为对数组的重复数据去除。 u...

R语言 删除重复值

最近手头下了一批数据,想要删除其中的重复值,比如: > data.set    Ensembl.Gene.ID Gene.Biotype Chromosome.Name Gene.St...
  • zmlsh
  • zmlsh
  • 2014年04月18日 15:40
  • 1777

去除重复行duplicated

df2

RStudio改变工作路径

1.用命令 getwd() 获取当前工作路径 setwd()设置工作路径 需要注意的是: linux下 相对路径 setwd("./Rsourse") 上一级目录serwd("../...

R语言read.table函数

read.table(file, header = FALSE, sep = "", quote = "\"'", dec = ".", numerals = c("allow....

R语言中两表连接且输出不重复数据

在做项目中遇到了如此问题,其中整理的结果表中没有会员ID信息,只有会员电话号码信息,且每一行为唯一一个会员。另外一张member表中包含会员ID以及会员电话信息,但是这张表有重复的会员信息,也就是说一...

R语言-数据预处理的一些实用(万能)办法:缺失值、数据重复、共线性等等的处理

R语言-数据预处理的一些实用(万能)办法:缺失值、数据重复、共线性等等的处理...
  • Trisyp
  • Trisyp
  • 2016年12月09日 13:02
  • 604

重复数据删除技术源代码C语言

  • 2017年03月02日 14:27
  • 93KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:R语言去重复数据
举报原因:
原因补充:

(最多只允许输入30个字)