- 博客(7)
- 收藏
- 关注
翻译 Duplicated 与unique
>DT <- data.table(A = rep(1:3, each=4), B = rep(1:4, each=3),+ C = rep(1:2, 6), key = "A,B")> DT A B C 1: 1 1 1 2: 1 1 2 3: 1 1 1 4: 1 2 2 5: 2 2 1 6: 2 2 2 7: ...
2018-12-31 14:26:45 930
翻译 经常问的问题
1.关于样本集的复制 > DT <- data.table(a=c(1,2), b=c(11,12))> DT2<-DT #用<-复制数据 集,新数据集改变后,原数据集会跟着一起改变> DT2[,new3:=3L]> DT2 a b new31: 1 11 32: 2 12 3 > ...
2018-12-31 14:24:31 986
翻译 长表和宽表的相互转化
使用 函数melt()和decast(),是reshape2包中函数的增强先考虑传统长宽表转化函数, 1.默认函数a.融合data.table(宽表到长表)考虑如下data.table:> DT = fread("melt_default.csv")> DT family_id age_mother dob_child1 dob_child2 dob_c...
2018-12-31 14:23:22 2830
翻译 二级索引和自动索引
1.二级指标a.什么是二级指标?二级指标类似于key在data.table中的作用,但是两者主要有如下差别: 它不会对整个data.table进行排序,而是只对当列排序,并将此列存储在属性中index指标中。 data.table中可以有多个二级指标b.设置和得到二级指标> setindex(flights, origin)> head(flights)[,-c(...
2018-12-31 14:21:52 352
翻译 Key(主键)和基于子集的快速检索
主键什么是主键 在前面我们讨论了如何用“i”进行提取子集的方法,这节我们采用另一种方法,用主键(key)来提取子集。开始,我们先看一个data.frame,每个data.frame都有一个行名称,先看下面一个data.frame DF :> set.seed(1L)> DF = data.frame(ID1 = sample(letters[1:2], 10, T...
2018-12-31 14:20:32 673
翻译 引用语义
上一篇的介绍,所有操作都产生了一个新的数据集,下面主要学习如何添加新的列,更新或删除列。 “:=”的使用 LHS := RHS表格DT[, c("colA", "colB", ...) := list(valA, valB, ...)] ---当只有一列的时候,就可以不用list(),即DT[, colA := valA] 功能表格DT[, `:=`(colA = va...
2018-12-31 14:19:00 240
翻译 data.table基础知识
#加载航班信息#fread 快速文件阅读器#使用data.table 亲自创建#如果列是字符型,则不能转化成因子型(factor)#data.table 不能设置和使用行名字。> library(data.table)> flights <- fread("flights14.csv")> flights> dim(flights) ...
2018-12-31 14:14:30 623
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人