自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

翻译 Duplicated 与unique

>DT <- data.table(A = rep(1:3, each=4), B = rep(1:4, each=3),+                  C = rep(1:2, 6), key = "A,B")> DT    A B C 1: 1 1 1 2: 1 1 2 3: 1 1 1 4: 1 2 2 5: 2 2 1 6: 2 2 2 7: ...

2018-12-31 14:26:45 930

翻译 经常问的问题

1.关于样本集的复制 > DT <- data.table(a=c(1,2), b=c(11,12))> DT2<-DT   #用<-复制数据 集,新数据集改变后,原数据集会跟着一起改变> DT2[,new3:=3L]> DT2   a  b new31: 1 11    32: 2 12    3  > ...

2018-12-31 14:24:31 986

翻译 长表和宽表的相互转化

使用 函数melt()和decast(),是reshape2包中函数的增强先考虑传统长宽表转化函数, 1.默认函数a.融合data.table(宽表到长表)考虑如下data.table:> DT = fread("melt_default.csv")> DT   family_id age_mother dob_child1 dob_child2 dob_c...

2018-12-31 14:23:22 2830

翻译 二级索引和自动索引

1.二级指标a.什么是二级指标?二级指标类似于key在data.table中的作用,但是两者主要有如下差别: 它不会对整个data.table进行排序,而是只对当列排序,并将此列存储在属性中index指标中。 data.table中可以有多个二级指标b.设置和得到二级指标> setindex(flights, origin)> head(flights)[,-c(...

2018-12-31 14:21:52 352

翻译 Key(主键)和基于子集的快速检索

主键什么是主键 在前面我们讨论了如何用“i”进行提取子集的方法,这节我们采用另一种方法,用主键(key)来提取子集。开始,我们先看一个data.frame,每个data.frame都有一个行名称,先看下面一个data.frame DF :> set.seed(1L)> DF = data.frame(ID1 = sample(letters[1:2], 10, T...

2018-12-31 14:20:32 673

翻译 引用语义

上一篇的介绍,所有操作都产生了一个新的数据集,下面主要学习如何添加新的列,更新或删除列。 “:=”的使用 LHS := RHS表格DT[, c("colA", "colB", ...) := list(valA, valB, ...)] ---当只有一列的时候,就可以不用list(),即DT[, colA := valA] 功能表格DT[, `:=`(colA = va...

2018-12-31 14:19:00 240

翻译 data.table基础知识

#加载航班信息#fread 快速文件阅读器#使用data.table 亲自创建#如果列是字符型,则不能转化成因子型(factor)#data.table 不能设置和使用行名字。> library(data.table)> flights <- fread("flights14.csv")> flights> dim(flights) ...

2018-12-31 14:14:30 623

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除