1、R语言简介:
与起源于贝尔实验室的S语言类似,R是为统计计算和绘图而生的,现在已经作为一套开源的数据分析解决方案。众所周知,SAS,SPSS,Stata,Excel等都是著名的数据处理与分析软件。与它们相比,R是开源的,得到社区的广泛支持,并且每天都在增加新的功能(从CRAN http://cran.r-project.org/ 上可以得到各领域、各专业的分析包);且在不同的操作系统平台(Windows、Mac OS X、Linux)中都有相应的R版本。R已经成了统计、预测分析和数据可视化的全球通用语言。
2、R的获取和安装
从CRAN上获取相应平台的二进制安装包,安装简易。还可以安装成为包(package)的可选模块来增强R的功能。安装好官方的R软件后,还可以获取R语言的IDE——RStudio来使R的使用和开发更加简易。
3、R新手上路
以上使用函数c()以向量的形式输入婴儿的月龄和体重数据,此函数可将其参数组合成一个向量或列表
这10名婴儿的平均体重是7.06 kg,标准差为2.08 kg,月龄和体重之间存在较强的线性关系(相关度= 0.91)。这种关系也可以散点图中看到。不出意料,随着月龄的增长,婴儿的体重也趋于增加。
注: R允许使用=为对象赋值,但是我们一般用<-来进行赋值,而不是传统的=
4、R获取帮助
打入如下命令:
从浏览器弹出帮助:
还可以输入命令:
demo()
来查看R软件中自带的demo
输入具体的demo,如
demo("graphics")就会显示关于绘图的相关demo
5、一个重要的概念:工作空间
- 工作空间(workspace)就是当前R的工作环境,它储存着所有用户定义的对象(向量、矩阵、函数、数据框、列表)。
- 在一个R会话结束时,你可以将当前工作空间保存到一个镜像中,并在下次启动R时自动载入它。
- 当前的工作目录(working directory)是R用来读取文件和保存结果的默认目录。我们可以使用函数getwd()来查看当前的工作目录,或使用函setwd()设定当前的工作目录。
- 如果需要读入一个不在当前工作目录下的文件,则需在调用语句中写明完整的路径。记得使用引号闭合这些目录名和文件名。
以下列出用于管理R工作空间的函数:
小技巧:若要一次性删除工作控件所有的对象,则可以运行 rm(list=ls())
rm()删除对象时,只会删除变量的引用,并不会立即清除占用的内存空间,失去引用的对象就成了内存中的垃圾,R清理垃圾的机制和JAVA很像,都是在一定时间内自动发现垃圾再集中清理。所以通过rm()删除对象后在Windows的任务管理器可以看到R进程占用的内存并没有被立即释放,而是过一段时间后才会清理。如果想要删除的对象立刻被清理,可以运行垃圾处理函数gc(),将会立刻释放空间。但是通常不是很必要,因为当内存不够时系统会自动清理垃圾的,我们要做的只是将不再使用的对象rm()掉,在写R程序时应该养成习惯。