R数据预处理
littlely_ll
Strive for the best, and prepare for the worst.
展开
-
dplyr包介绍
1. arrange用法:按照变量管理行。arrange(.data, ...)data为要处理的列;...为要按照某变量排列,默认为升序排列。arrange(mtcars, cyl,disp) ##按照变量cyl, disp排序> arrange(mtcars, cyl,disp) ##按照变量cyl, disp排序 mpg cyl disp hp drat wt qs...原创 2017-02-04 21:27:12 · 563 阅读 · 0 评论 -
tidyr之gather、separate、spread…
使用tidyr的时候也有可能需要dplyr包。gather的用法: gather(data, key, value, ..., na.rm = FALSE, convert = FALSE,factor_key = FALSE)data为要处理的数据,key为新创建的变量,value为创建变量下的数值。...为列的设定,比如下面的例子创建变量stock,而不需要把time变成变量下的数值,则用...原创 2017-02-04 21:27:09 · 5433 阅读 · 0 评论 -
data.table简介
data.table是一个十分有效的数据处理包,它是data.frame的一个扩展,能够快速的对数据进行分片,分组,聚合等操作,比data.frame快很多。在数据处理方面,据实验结果表明,对于2G的数据,tapply耗时16秒,而data.table耗时1.6秒,快了10倍,官方还介绍说,对于100G的数据,它还能运行很好。 下面介绍几个主要用到的函数:fread和read.table相似,但是原创 2017-04-11 14:01:29 · 954 阅读 · 0 评论