1. 为什么选择R语言
- 可以进行数据分析
数据分析主要包括五个过程:
① 数据获取
② 数据处理
③ 描述性统计
④ 数据建模
⑤ 数据展示
使用R语言可以进行上述五个过程。首先,R语言可以手动输入数据,并允许从其他软件中导入数据,甚至可以通过一些函数从网页等爬取数据。其次,R语言中的基础函数以及一些开发人员开发的相关包可以对数据进行整理,汇总,注释。然后,在得到可以使用的数据后可以使用R语言进行描述性统计,根据数据的特征建立相关模型,R的用户提供了大量的相关包,可以进行方差分析、主成分分析以及回归等。最后,可以将结果进行展示。制图功能是R语言的一大优势,使用R可以绘制各种复杂美观的图形。 - 免费、开源
R是开源的,免费的,可以从R官网下载。
同时还有相关的图形化界面的软件,如:Rstudio(https://www.rstudio.com/products/rstudio/download/) - 向量操作
R中很多函数可以直接对向量进行计算,从而避免了大量的循环语句的使用,使得代码更为简洁。这也是使用R语言应当注意的一点:使用向量操作,而不是大段大段的循环语句。
2. 在学习R语言之前应当先明白的:
- 数据分析是不存在标准答案的,分析的方法有很多,R语言只是一个工具,分析效果如何还是要看个人能力
- R语言的学习曲线是比较陡峭的,入门较为容易,但随着学习的深入,需要耗费的精力也会随之越来越多
3. R语言相关内容
- R语言使用 # 来表示注释,每一行 # 之后的内容会被R忽视
- 使用getwd()可以查看R语言当前工作目录,使用setwd(“指定目录”)可以设定当前工作目录,设定的工作目录仅在本次会话中有效,重启R,工作目录恢复默认目录。使用dir.create(“文件夹名称及地址”)可以创建新的文件夹
- 有很多相关的包可以使用,所下载的包会保存在电脑的某个目录之下,使用.libPaths()可以查看包所在位置。
使用install.package(“包的名称”)可以下载包,update.package( )可以更新已下载的包,在使用包之前需要加载相关包,使用library(“包的名称”), 使用search( )可以查看已下载安装的所有包。 - 使用help()可以获得所需的帮助
- R语言区分大小写,如help()和Help()是不同的