R语言--减去某只出现过N次的所在的行

VIP文章豆芽炒粉丝

于 2016-03-12 14:13:08 发布

阅读量2.2k

点赞数 3

分类专栏： R语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dingchenxixi/article/details/50865277

版权

需要解决的问题描述：

用户购买物品数据集，每行存储数据格式(user_id,item_id,category_id,ratings,helpfulness,timestamp)

数据事例：

去除那些item_id只出现过一次的行。问题的规模：922267obs of 2 variables

查找过资料发现如下两个方法：

1.定义一个函数

deleteuniquelines <- function(x) {# x为输入的数据框
stand.col <- x[, 1] # 设根据x的第一列进行删除操作 x[,1]中1为第一列 2为第二列以此类推
count <- table(stand.col) #table函数可以得到每个上述列每个数所出现的频数
if (all(count < 2)) stop("no repeated records")
else {
ind <- sapply(stand.col, function(t) ifelse(count[as.character(t)] > 1, TRUE, FALSE))
}
return(x[ind, ])
}

test <- data.frame(name = c(1, 1, 2, 3, 3), score = c(2, 2, 3, 2, 4))#测试用例

deleteuniqueli

最低0.47元/天解锁文章

豆芽炒粉丝

关注

3
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
R语言--减去某只出现过N次的所在的行

需要解决的问题描述：用户购买物品数据集，每行存储数据格式(user_id,item_id,category_id,ratings,helpfulness,timestamp)数据事例：去除那些item_id只出现过一次的行。问题的规模：922267obs of 2 variables查找过资料发现如下两个方法：1.定义一个函数deleteuniquelines
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。