基础部分
常用命令:
# 创建一个独立的子目录work 来保存你要在这个系统上用R分析的数据文件。当你用R处理这些数据时,这将是你的工作目录
mkdir work
cd work
#用命令启动R程序。
R
#退出
q()
# 帮助部分,查看函数功能,类似matlab
help(solve)
或者
?solve
# 对于有特殊含义的字符,可以加上双引号或者单引号
#在大多数R平台中,你可以通过运行下面的命令得到HTML格式的帮助。
help.start()
#Windows 版本的R 还有其他可选的帮助工具:你可以利用下面的命令得到更多
的信息
?help
#执行某个脚本文件
source("commands.R")
#对文本定向输出,可用sink(),对图像定向输出函数名即为图像格式如下
bmp("a.bmp") jpeg("a.jpeg") png("a.png")
# sink()可以把所有后续的输出结果从控制台重定向到外部文件,文件名和后缀自定义
#参数append=TRUE可以将文本追加到文件后,而不是覆盖它
#参数split=TRUE可将输出同时发送到屏幕和输出文件中
#不加参数调用命令sink()将仅向屏幕返回输出结果
sink("record.lis", append=TRUE, split=TRUE)
#关闭图像设备
dev.off()
包的载入与使用
# 安装特定包 括号内为包名 双引号
update.packages()
之后要用library()命令载入,此时不用双引号
批处理的部分没看懂:
数据结构
R中有许多用于存储数据的结构,包括标量、向量、数组、数据框和列表。
在R中,PatientID、AdmDate和Age为数值型变量,而Diabetes和Status 则为字符型变量。另外,你需要分别告诉R:PatientID是实例标识符,AdmDate含有日期数据, Diabetes和Status分别是名义型和有序型变量。R将实例标识符称为rownames(行名),将类 别型(包括名义型和有序型)变量称为因子(factors)
向量
建立向量:和python不同的是,需要使用函数:
a <- c(1, 2, 5, 3, 6, -2, 4)
b <- c("one", "two", "three")
c <- c(TRUE, TRUE, TRUE, FALSE, TRUE, FALSE)
不同的是,R的索引是从1开始的而非其他编程语言中的从0开始
a <- c(2:6)等价于a <- c(2, 3, 4, 5, 6)
标量是只有一个元素的向量
矩阵
通 过函数matrix()创建矩阵。一般使用格式
myymatrix <- matrix(vector, nrow=number_of_rows, ncol=number_of_columns,
byrow=logical_value,
dimnames=list(char_vector_rownames, char_vector_colnames))
vector包含了矩阵的元素,nrow和ncol用以指定行和列的维数,dimnames包含了可选 的、以字符型向量表示的行名和列名。选项byrow则表明矩阵应当按行填充(byrow=TRUE) 还是按列填充(byrow=FALSE),默认情况下按列填充。