R2——创建数据集
前言
创建和读取含有研究信息的数据是数据分析的第一步。在R中,这个任务包含以下三步:
1. 选择一种数据结构储存数据
2. 讲数据输入或导入到这个数据结构中
3. 对数据进行预处理,比如结构化数据
本章回答了如下几个问题:
1. R中储存和使用的数据结构有哪些?
2. 如何读取各类来源的数据?
3. 如何对读取的数据进行标注处理?
4. 在实际中可能使用到哪些处理数据集的函数?
数据集的概念
数据集通常是由数据构成的一个矩阵数组,行表示观测,列表示变量。如下图:
R可以处理的数据类型(模式)如下图:
数据结构
section1 向量
向量:用于存储数值型、字符型或逻辑型数据的一维数组。
值得注意的是,单个向量中的数据必须有相同的类型或模式。同一向量中无法混杂不同模式的数据。
标量是只含一个元素的向量,例如f<-3,g<-“US”等。它们用于保存常量。
如何创建向量?
a <- c(1,2,3,4)
b <- c("one","two")
c <- c(TRUE,FALSE,TRUE)
如何读取向量中的元素?
a <- c("k","g","j","h","q","w","t","u","i")
a[3]
a[c(1,2,4)]
a[