当我们平时处理csv等一系列文件时,通常希望只选择其中某几列,或者符合条件的某几行。则可以通过dplyr包中的一些函数实现。
library(dplyr)
table <- data.frame(cbind(c(1,2,3), c('Li','Zhang','Li'), c(11,13,15)))%>%rename(id = X1, name = X2, score = X3)
假如现在我有这么一个简单的表,第一列是id,第二列是名字,第三列是分数。比如我想只选则名字这一列,则
table%>%dplyr::select(name)
则会只选择第二列, 同样我也可以选择多列, 通过逗号隔开即可:
table%>%dplyr::select(name, score)
如果想根据某一个属性选择匹配的行,则用filter
比如选择所有叫Li的人:
table%>%filter(name == 'Li')
filter里面也可以使用判断语句和复合条件。