R的优势主要体现在其软件包生态系统上,即常说的R包。具体的R包在官网上。这些R包提供了涉及各个领域的强大功能,包括数据读取、可视化绘图、计算统计等。正因为R包的跨度非常大,所以R语言如此流行。
认识R包
- 包是R函数、数据、预编译代码以一种定义完善的格式组成的集合
- 计算机上存储包的目录称为库(library)
- 函数.libPaths()能够显示库所在的位置
- 函数library()则可以显示库中有哪些包
- R自带了一系列默认包(包括base、datasets、utils、grDevices、graphics、stats以及methods),它们提供了种类繁多的默认函数和数据集。其他包可通过下载来进行安装
掌握常用的R包
常用R包可划分为:
- 空间数据分析类
- 机器学习与统计学习类
- 多元统计类
- 药物动力学数据分析类
- 计量经济类
- 金融分析类
- 并行计算类
- 数据库访问类
机器学习与统计学习类别就包含有实现分类、聚类、关联规则、时间序列分析等功能的R包,通过加载不同的R包就能够实现相应的数据挖掘功能
包的使用
- 包的安装是指从某个CRAN镜像站点下载它并将其放入库中的过程。要在R会话中使用它,还需要使用library()命令载入这个包
- 载入一个包之后,就可以使用一系列的新的函数和数据集了
使用包时常见的错误
- 错误的大小写
- 忘记使用必要的引号
- 函数调用时忘记使用括号
- 使用了尚未载入包中的函数