1、data.table简介
R语言data.frame包的扩展,为R语言提供了快速整合金和处理大型数据的能力。学习data.table可以结合SQL语句学习,理解起来就很简单了。下面具体介绍一下data.table中。
data.table基本命令语法为:DT[i, j, by]。
参数的理解可以结合SQL语句中的关键词来理解。
DT为操作对象
i类似于SQL中的关键词where,主要起到过滤作用的。
j类似于SQL中的关键词select,主要用于查询、更新数据等。这里添加新的字段使用“:=”函数;
by类似于SQL中group by函数,进行数据分组,主要和聚合函数一起使用。
SQL中关键词的书写顺序为select—from—where—group by—having—order by,执行顺序为from –where –group by—having –select—order by。
仅仅看SQL中的select、from和where三个关键词来理解DT[i, j, by]。对于data.table,可以从SQL中关键词的执行顺利来理解DT[i, j, by],DT可以理解为from, i理解为where, j理解为select。
2、数据类型转换
使用data.table()函数将data.frame类型的数据转换为data.table类型数据,例如:
##加载data.tab