关闭

R语言去重复数据

标签: 函数r语言数据
4079人阅读 评论(0) 收藏 举报
分类:

本次总结来源网络,有多处参考

在R语言中,去掉重复数据的函数是:duplicated

删掉所有列中数据一样的:

>test <- data.frame(
  x1 = c(1,2,3,4,5,1,3,5),
  x2 = c("a","b","c","d","e","a","b","e"),
  x3 = c("a","b","c","d","e","a","c","e"))
> test
  x1 x2 x3
1  1  a  a
2  2  b  b
3  3  c  c
4  4  d  d
5  5  e  e
6  1  a  a
7  3  b  c
8  5  e  e

> test[!duplicated(test),] #删掉所有列上都重复的
  x1 x2 x3
1  1  a  a
2  2  b  b
3  3  c  c
4  4  d  d
5  5  e  e
7  3  b  c

选择性的删除重复的

> test[!duplicated(test[,c(2,3)]),]
  x1 x2 x3
1  1  a  a
2  2  b  b
3  3  c  c
4  4  d  d
5  5  e  e
7  3  b  c
0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:136956次
    • 积分:2926
    • 等级:
    • 排名:第12095名
    • 原创:148篇
    • 转载:7篇
    • 译文:1篇
    • 评论:59条
    最新评论