library(rvest)
library(magrittr)
library(dplyr)
library(tidyr)
…
magrittr包 : 通过管道的方式让连续复杂数据的处理操作,代码更短,更容易读,甚至一行代码可以搞定原来10行代码的事情。
LINK : R语言高效的管道操作magrittr
dplyr包 : 数据处理的强大的包,dplyr包 像操作数据库一样操作 R。
dplyr包的核心函数
filter 按行筛选
arrange 给行排序
select 按列筛选
mutate 根据原有列生成新列
summarize 数据进行分组进行分析
LINK: 高效数据整理工具——dplyr
tidyr包:数据处理的起步,相对来说属于R包里简单的了。
核心函数主要有:
(1)gather() 、spread() #数据框的变形
(2)drop_na()、 fill() 、replace_na()处理数据框中的空值
(3)根据一个表格衍生出其他表格
(4)separate() 、separate_row()、 unite() 实现行或列的分割和合并
LINK: 神奇R包tidyr
mice包:
函数 : mice(data,method = “”)
函数na.omit()直接删除缺失值。
LINK: 用R语言填充缺失值mice