R语言在数据处理方面有其独到的优势
今天介绍几个常见的数据处理的方法
1.向一横行的数据里面加入一列变量 R语言
用transform函数
向data这个是数据框中中加入id这一列,其中id是值是name
data <- transform(data,id=name)
2.把一列数据转变为一横行的数据
t()这个函数,不需专门加载包
data <- t(data)
这个跟excel里面的转置的功能差不多
3.筛选子集,跨数据库筛出某个特定条件下的数据
用 %in%
比如 a %in% b
在a里面筛选出包含在b里面的数据
一般是和subset()一起联合使用
在a这个数据框中筛选出id在b数据框的数据,subset这个函数其实是取a这个数据框的子集
a <- subset(a,a$id %in% b$id)
本身subset()这个功能跟excel的筛选功能差不多,就是选取一个数据库的子集,但是联合了 %in% 之后,就可以实现跨数据库的筛选和匹配了,功能有点类似于Excel的vlookup的功能,当然,在可视化这个方面,excel要比r语言更胜一筹。