2018年12月_m0_38093796

翻译 Duplicated 与unique

>DT <- data.table(A = rep(1:3, each=4), B = rep(1:4, each=3),+ C = rep(1:2, 6), key = "A,B")> DT A B C 1: 1 1 1 2: 1 1 2 3: 1 1 1 4: 1 2 2 5: 2 2 1 6: 2 2 2 7: ...

2018-12-31 14:26:45 930

翻译经常问的问题

1.关于样本集的复制 > DT <- data.table(a=c(1,2), b=c(11,12))> DT2<-DT #用<-复制数据集，新数据集改变后，原数据集会跟着一起改变> DT2[,new3:=3L]> DT2 a b new31: 1 11 32: 2 12 3 > ...

2018-12-31 14:24:31 986

翻译长表和宽表的相互转化

使用函数melt()和decast()，是reshape2包中函数的增强先考虑传统长宽表转化函数， 1.默认函数a.融合data.table（宽表到长表）考虑如下data.table:> DT = fread("melt_default.csv")> DT family_id age_mother dob_child1 dob_child2 dob_c...

2018-12-31 14:23:22 2830

翻译二级索引和自动索引

1.二级指标a.什么是二级指标？二级指标类似于key在data.table中的作用，但是两者主要有如下差别：它不会对整个data.table进行排序，而是只对当列排序，并将此列存储在属性中index指标中。 data.table中可以有多个二级指标b.设置和得到二级指标> setindex(flights, origin)> head(flights)[,-c(...

2018-12-31 14:21:52 352

翻译 Key(主键)和基于子集的快速检索

主键什么是主键在前面我们讨论了如何用“i”进行提取子集的方法，这节我们采用另一种方法，用主键（key）来提取子集。开始，我们先看一个data.frame,每个data.frame都有一个行名称，先看下面一个data.frame DF :> set.seed(1L)> DF = data.frame(ID1 = sample(letters[1:2], 10, T...

2018-12-31 14:20:32 673

翻译引用语义

上一篇的介绍，所有操作都产生了一个新的数据集，下面主要学习如何添加新的列，更新或删除列。 “：=”的使用 LHS := RHS表格DT[, c("colA", "colB", ...) := list(valA, valB, ...)] ---当只有一列的时候，就可以不用list(),即DT[, colA := valA] 功能表格DT[, `:=`(colA = va...

2018-12-31 14:19:00 240

翻译 data.table基础知识

#加载航班信息#fread 快速文件阅读器#使用data.table 亲自创建#如果列是字符型，则不能转化成因子型（factor）#data.table 不能设置和使用行名字。> library(data.table)> flights <- fread("flights14.csv")> flights> dim(flights) ...

2018-12-31 14:14:30 623

m0_38093796的博客