目录
1. R的基本内容
R 的交互式解释器通常称作“读入-求值-输出”循环(Read-Evaluate-Print Loop,REPL)。此解释器以输入提示符 > 作为开始,表示 R 正在等待输入。
R 也可以读取和执行以 .R 为扩展名的完整文件,该文件包括命令和函数。通常,任何一个大的应用程序由多个 .R 文件组成,每个文件通常被称为一个模块。我们将在接下来的各节中探索 R 的主要特点和功能。
1.1 科学计算器
R 中最基本的元素包括变量和算术运算符,在 R 中一切都是以向量形式存在的。
> 1 / 0
[1] Inf
> num <- 3
> num ^ 2 + 5 / 5
[1] 10
1.2 向量运算
> x <- 1:5
> y <- 6:10
> z <- x + y
上述代码中,我们用 + 运算符把两个向量相加,而没有使用任何循环,称之为向量化。
1.3 特殊值
在数据分析过程中,你将处理大量混啊乱的数据,所以 R 中的特殊值十分重要。我们关心的主要值包括:Inf,代表无穷大(Infinity);NaN,代表非数值(Not a Number);NA,代表缺失值(Not Available)。下面的代码片段展示了对特殊值的逻辑测试和结果,这些函数在清洗数据时十分有用。
> vec <- c(0,Inf,NaN,NA)
> is.finite(vec)
[1] TRUE FALSE FALSE FALSE
> is.infinite(vec)
[1] FALSE TRUE FALSE FALSE
> is.nan(vec)
[1] FALSE FALSE TRUE FALSE
> is.na(vec)
[1] FALSE FALSE TRUE TRUE
2. R的数据结构
2.1 向量
向量是一维数据结构,可以用 length() 获取向量中的元素个数。
生成向