R语言基础知识
一、R在医学科研与论文写作中的应用场景
使用R语言的原因:
完全开源、免费使用、绘图功能强大,但需要一定的R语言基础
相关书籍:《R语言实践》、《R语言同济入门》、《R语言使用教程》、《R语言与医学统计图册》
二、R语言的安装
R语言官方下载地址:https://www.r-project.org/
一般不会直接使用R软件,而是采用Rstudio进行操作。Rstudio官方下载地址:
https://www.rstudio.com/
备注:Rstudio安装后会自动匹配已安装过的R软件
三、工作空间
工作空间(workspace)就是当前R的工作环境,它存储着所有用户定义的对象(向量、矩阵、函数、数据框、列表)
setwd("d:/dxyclass/ch01") # change the path to one of your directories
options()
options(digits=3)
x <- runif(20)
summary(x)
hist(x)
savehistory()
save.image()
四、packages包
- 包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。计算机上存储包的目录称为(library)。函数.libPaths()能够显示库所在的位置, 函数library()则可以显示库中有哪些包。
- R自带了一系列默认包(包括base、 datasets、 utils、grDevices、 graphics、 stats以及methods),它们提供了种类繁多的默认函数和数据集。其他包可通过下载来进行安装。安装好以后,它们必须被载入到会话中才能使用。命令search()可以告诉你哪些包已加载并可使用
1、包安装方法
使用命令 install.packages(“gclus”), 下载和安装包
➢ 使用命令 update.packages(), 更新已经安装的包
➢ 使用命令 installed.packages(), 列出已安装的包
或者,另一种用鼠标操作方法:
tools-install packages中输入要安装的包
2、包载入方法
要在R会话中使用包,还需要使用library()命令载入这个包。例如,要使用gclus包,执行命令library(gclus)即可。当然,在载入一个包之前必须已经安装了这个包。在一个会话中,包只需载入一次
help.start()
install.packages("vcd")
help(package="vcd")
library(vcd)
help(Arthritis)
Arthritis
example(Arthritis)
五、获取帮助
较为常用的方式是:
??survival #指做生存分析的包
?CUXPH #指包中函数
六、R语言编程中的常见错误
- 使用了错误的大小写。 help()、 Help() 和 HELP() 是三个不同的函数(只有第一个是正确的)
- 忘记使用必要的引号。 install.packages(“gclus”) 能够正常执行,然而Install.packages(gclus)将会报错
- 在函数调用时忘记使用括号。例如,要使用help()而非help。即使函数无需参数,仍需加上()
- 在Windows上,路径名中使用了\。 R将反斜杠视为一个转义字符,setwd(“c:\mydata”)会报错。正确写法是setwd(“c:/mydata”)或setwd(“c:\mydata”)
- 使用了一个尚未载入包中的函数。函数order.clusters()包含在包gclus中。如果
还没有载入这个包就使用它,将会报错
七、R语言中数据集的创建
常见的数据结构有:向量、矩阵(同一属性)、数据框、列表、数组
1、标量与向量
标量是只含一个元素的向量,例如: f <- 3、 g <- “US” 和 h <- TRUE。它们用于保存常量。
向量是用于存储数值型、字符型或逻辑型数据的一维数组。执行组合功能的**函数c()**可用来创建向量
各类向量如下例所示:
a <- c(1, 2, 5, 3, 6, -2, 4)
b <- c("one", "two", "three")
c <- c(TRUE, TRUE, TRUE, FALSE, TRUE, FALSE)
#查看向量中的值
a <- c(1, 2, 5, 3, 6, -2, 4)
a[3]
a[c(1, 3, 5)]
a[2:6]
a <- c("k", "j", "h", "a", "c", "m")
a[3]
a[c(1, 3, 5)]
a[2:6]
2、矩阵
矩阵是一个二维数组,只是每个元素都拥有相同的模式(数值型、字符型或逻辑型),可通过函数 matrix()