3.R包的使用、结果的重用、如何处理大数据

1.1 什么是包?
包是 R 函数、数据、预编译代码以一种定义完善的格式组成的集合。计算机上存储包的目录称为 library )。函数 .libPaths() 能够显示库所在的位置, 函数 library() 则可以显示库中 有哪些包。
R 自带了一系列默认包(包括 base datasets utils grDevices graphics stats methods ),它们提供了种类繁多的默认函数和数据集。其他包可通过下载来进行安装。安装 好以后,它们必须被载入到会话中才能使用。命令 search() 可以告诉你哪些包已加载并可使用。
1.2 包的下载
下载地址http://cran.r-project.org/web/packages
第一次安装一个包,使用命令 install.packages() 即可。举例来说,不加参数执行 install.packages() 将显示一个 CRAN 镜像站点的列表,选择其中一 个镜像站点之后,将看到所有可用包的列表,选择其中的一个包即可进行下载和安装。
一个包仅需安装一次。但和其他软件类似,包经常被其作者更新。使用命令 update.packages() 可以更新已经安装的包。要查看已安装包的描述,可以使用 installed.packages() 命令,这 将列出安装的包,以及它们的版本号、依赖关系等信息。
1.3 包的载入
包的安装是指从某个 CRAN 镜像站点下载它并将其放入库中的过程。要在 R 会话中使用它,还需要使用 library() 命令载入这个包。在一个会话中,包只需载入一次。
例如,要使用 gclus 包,执行命令 library(gclus)即可。当然,在载入一个包之前必须已经安装了这个包。
1.4 包的使用方法
载入一个包之后,就可以使用一系列新的函数和数据集了。
命令 help(package="package_name") 可以输出个包的简短描述以及包中的函数名称和数据集名称的列表。使用函数 help() 可以查看其中任意 函数或数据集的更多细节。这些信息也能以 PDF 帮助手册的形式从 CRAN 下载。

 2.1 将输出用为输入——结果的重用

首先,利用汽车数据 mtcars 执行一次简单线性回归,通过车身重量( wt )预测每加仑行驶
的英里数( mpg)。可以通过以下语句实现:
head(mtcars) # mtcars数据集里前六条信息

结果将显示在屏幕上,不会保存任何信息。下一步,执行回归,区别是在一个对象中保存结果:
lm(mpg~wt,data=mtcars)
result <- lm(mpg~wt,data=mtcars)
以上赋值语句创建了一个名为 lm 的列表对象,其中包含了分析的大量信息(包括预测值、残
差、回归系数等)。虽然屏幕上没有显示任何输出,但分析结果可在稍后被显示和继续使用。
键入 summary(result) 将显示分析结果的统计概要,
plot(result) 将生成回归诊断图形。 
要了解某个函数的返回值,查阅这个函数在线帮助文档中的“ Value ”部分即可。本例中应 当查阅 help(lm) ?lm 中的对应部分。这样就可以知道将某个函数的结果赋值到一个对象时, 保存下来的结果具体是什么。

 

3.1 处理大数据集

由于 R 在内存中存储对象,往往会受限于可用的内存量。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值