1.1 什么是包?
包是
R
函数、数据、预编译代码以一种定义完善的格式组成的集合。计算机上存储包的目录称为
库
(
library
)。函数
.libPaths()
能够显示库所在的位置, 函数
library()
则可以显示库中
有哪些包。
R
自带了一系列默认包(包括
base
、
datasets
、
utils
、
grDevices
、
graphics
、
stats
以
methods
),它们提供了种类繁多的默认函数和数据集。其他包可通过下载来进行安装。安装
好以后,它们必须被载入到会话中才能使用。命令
search()
可以告诉你哪些包已加载并可使用。
1.2 包的下载
下载地址http://cran.r-project.org/web/packages
第一次安装一个包,使用命令
install.packages()
即可。举例来说,不加参数执行
install.packages()
将显示一个
CRAN
镜像站点的列表,选择其中一
个镜像站点之后,将看到所有可用包的列表,选择其中的一个包即可进行下载和安装。
一个包仅需安装一次。但和其他软件类似,包经常被其作者更新。使用命令
update.packages()
可以更新已经安装的包。要查看已安装包的描述,可以使用
installed.packages()
命令,这
将列出安装的包,以及它们的版本号、依赖关系等信息。
1.3 包的载入
包的安装是指从某个
CRAN
镜像站点下载它并将其放入库中的过程。要在
R
会话中使用它,还需要使用
library()
命令载入这个包。在一个会话中,包只需载入一次。
例如,要使用
gclus
包,执行命令
library(gclus)即可。当然,在载入一个包之前必须已经安装了这个包。
![](https://img-blog.csdnimg.cn/7fc0f49021ff4d5995dfa04d98998c6e.png)
1.4 包的使用方法
载入一个包之后,就可以使用一系列新的函数和数据集了。
命令
help(package="package_name")
可以输出个包的简短描述以及包中的函数名称和数据集名称的列表。使用函数
help()
可以查看其中任意
函数或数据集的更多细节。这些信息也能以
PDF
帮助手册的形式从
CRAN
下载。
![](https://img-blog.csdnimg.cn/2aeaf13697754f96bf4ab7dd3e17c65d.png)
2.1 将输出用为输入——结果的重用
首先,利用汽车数据
mtcars
执行一次简单线性回归,通过车身重量(
wt
)预测每加仑行驶
的英里数(
mpg)。可以通过以下语句实现:
plot(result)
将生成回归诊断图形。
head(mtcars) # mtcars数据集里前六条信息
结果将显示在屏幕上,不会保存任何信息。下一步,执行回归,区别是在一个对象中保存结果:
lm(mpg~wt,data=mtcars)
result <- lm(mpg~wt,data=mtcars)
以上赋值语句创建了一个名为
lm
的列表对象,其中包含了分析的大量信息(包括预测值、残
差、回归系数等)。虽然屏幕上没有显示任何输出,但分析结果可在稍后被显示和继续使用。
键入
summary(result)
将显示分析结果的统计概要,
![](https://img-blog.csdnimg.cn/0c2932f80f884320b30192ff95915a16.png)
要了解某个函数的返回值,查阅这个函数在线帮助文档中的“
Value
”部分即可。本例中应
当查阅
help(lm)
或
?lm
中的对应部分。这样就可以知道将某个函数的结果赋值到一个对象时,
保存下来的结果具体是什么。
3.1 处理大数据集
由于
R
在内存中存储对象,往往会受限于可用的内存量。
![](https://img-blog.csdnimg.cn/9d26d48e608a4a1d9d0248c3e55417b3.png)