R语言基本操作
1 工作目录
我目前理解的工作目录类似于在windows下你所处的文件夹,在某个工作目录运行代码,所产生的工作文件就会储存在该目录。一般windows安装R的时候,默认工作目录就是文档。默认工作目录储存在Rprofile.site文件中,可以在该文件中将默认工作目录替换为常用的目录。
1.1修改当前工作目录
我们常常会同时进行多个分析任务,可以为不同的分析任务创建不同的工作目录,并将工作目录的名称设置为自己/他人能理解的文本,随后进行哪一项分析任务就打开所对应的工作目录。
dir.create()#创建一个新目录,注意两点:在()可以通过输入绝对路径新建目录,也可以根据当前所处的目录新建目录,但都需要添加英文状态下的双引号"";其次,某些文章中称要在windows环境下输入反斜杠\作为不同层级目录分隔符,实际操作发现不需反斜杠,直接输入/即可。
setwd()#设置工作目录,注意这个是临时设置,每次启动R或Rstudio都会恢复Rprofile.site所保存的默认工作目录。
.First <- function(){
setwd(“your/work/path”)
}#在Rprofile.site文件添加,R在启动时会先执行这一段命令修改工作目录,但是我认为不必要。
1.2为某项分析任务新建专属工作目录
好记性不如烂笔头,按照标准数据分析规则可以帮助他人理解自己的分析工作(比如你在服务器中工作,需要和他人合作),对自己的好处是避免遗忘已经分析产生的过程数据是什么,导致工作重复。
.
└── my_awesome_project
├── src
├── output
├── data
│ ├── rawdata
│ └── processed
├── reports
├── README.md
├── analysis.R
└── .gitignore
以上参考了一个R分析工作的标准目录。/output
存放已经分析结束的图、表,可以直接利用或让他人读取。/data 目录下有存放原始数据的/rawdata
与存放过程文件的/processed
,分析代码.R
文件存放在项目文件夹根目录,如一个完整的任务由多个代码块组成,可以先将已经完成的部分保存,存放在/src
文件夹,其他按需设置。
为路径设置别名?方便减少输入路径。
1.3查看目录和文件
ls()#查看当前工作环境中产生/设置的对象(object)
dir()#查看当前目录下的子目录和文件
以上两个命令的**()**中不输入路径,默认是当前路径;也可以输入"/path"指定某一个目录,类似linux。
其他:处理过程数据
分析过程中会产生一些过程数据,如果从头运行完成的项目代码,每次运行都会产生一次过程数据。首先可以将代码分块,下一级代码利用上一级代码产生的数据;其次,产生的临时文件确定无需利用时,可以存放在/temp
目录中,这些文件在学习或测试某些功能时会经常产生。