在做项目的过程中遇到筛选不重复的会员信息进行匹配,本次介绍五种筛选不重复行的数据:
五种方法如下:
>>> library(dplyr)
>>> library(sqldf)
方法一:
>>> data1 <- data7_0 %>%
group_by(CELLPHONE,MEMBERID) %>%
filter(row_number() == 1) %>%
ungroup()
方法二:
>>> data2 <- data7_0 %>%
distinct(CELLPHONE,MEMBERID, .keep_all = TRUE)
方法三:
>>> data3 <- sqldf("select DISTINCT CELLPHONE,MEMBERID from data7_0")
方法四:
>>> data4 <- base::unique(data7_0)
方法五:
>>> data5 <- as.data.table(data7_0[!duplicated(data7_0$CELLPHONE), ])