第一章 R语言介绍
(1)R的赋值符号为<-:
# 创建一个名为x的向量,包含5个标准正态分布的随机偏差
x <- rnorm(5)
R可以反方向赋值,即:
rnorm <- x
与上面语句等价。
(2)可以使用函数getwd()来查看当前的工作目录,或使用函数setwd()设定当前的工作目录
用于管理R工作空间的函数见《R语言实战》P11
(3)R文件输入
#在当前会话中执行filename的代码并将结果返回屏幕
source("filename")
当不加路径时,默认该文件再当前工作目录中,否则要加完整路径。
(4)文本输出
sink("filename")
将输出重定向到文件filename中去。默认情况下,如果文件已经存在,则它的内容将被覆盖。使用参数append=TRUE可以将文本追加到文件后,而不是覆盖它。参数split=TRUE
可将输出同时发送到屏幕和输出文件中。不加参数调用命令sink()
将仅向屏幕返回输出结果。
比如下例,执行script.R文件,结果显示在屏幕上,同时文本输出被追加到myoutput中,图形输出保存到文件mygraphs.pdf中:
#
sink("myoutput",append=TRUE,split=TRUE)
pdf("mugraphs.pdf")
source("script.R")
(5)图形输出
输出函数见书P12.最后使用dev.off()将输出返回终端
(6)包
安装:install.packages()
更新:update.packages()
查看已经安装的包的信息:installed.packages()
包的载入:library()
在一个会话中,包只需载入一次。如果需要,你可以自定义启动环境以自动载入会频繁使用的那些包。
(7)注意点
- ### R对大小写敏感
- ### 路径名使用正斜杠\
第二章 创建数据集
(1)数据结构
- ### 向量
比如:
a <- c(1,2,3,4)
b <- c("one","two","three")
#因为c为R的内置函数名,最好不要使用c作为对象名
c <- c(TRUE,TRUE,FALSE,FALSE)
注意:比如e <- 3
、f <- "US"
为标量
中括号表示访问元素位置,比如a[c(2,4)]
表示访问向量a中第2和第4个元素,不能写成a[2,4]
.
可以使用冒号生成数值序列,比如:
a <- c(2:6)
等价于
a <- c(2,3,4,5,6)
- ### 矩阵
形式如下:
mymatrix <- matrix(vector,nrow=number_of_rows,ncol=number_of_columns,byrow=TRUEorFALSE,dimnames=list(char_vector_rownames,char_vector_colnames))
例1:创建5*4的矩阵
y <- matrix(1:20,nrow=5,ncol=4)
例2:按行填充2*2矩阵
cells <- c(1,26,24,68)
rnames <- c("R1","R2")
cnames <- c("C1","C2")
y <- matrix(cells,nrow=