最近在进行几个软件包的测评,里面不乏R包,但实际跑下来感觉限速步骤有点坑,要么分特别多批跑很麻烦,要么合在一起跑就会超级无敌巨无霸慢,占着Rstudio也很浪费时间。我的数据也比较多且都很大,考虑把这些代码挂在Linux后台运行。
然后我参考了网上的一些办法,最后自己是这样实现的:
首先安装optparse包,这个包可以传递命令行参数也可以生成帮助文档:
install.packages("optparse")
library(optparse)
然后进行参数设置,参数解析与参数传递:
# setting parameters
option_list <- list(
make_option( c("-i", "--input"), type = "character", default = FALSE, help = "input folder location"),
make_option( c("-o", "--output"), type = "character", default = "./", help = "output file location"),
make_option( c("-s", "--sample"), type = "character", default = FALSE, help = "sample name")
)
# Analytic parameters
opt_parser = OptionParser(option_list=option_list)
opt = parse_args(opt_parser)
# passing parameters
x1 = opt$input
y1 = opt$output
z1 = opt$sample
之后将我要执行的代码块放进去修改一下,检查通顺后加上输出语句:
location = y1
filename = z1
saveRDS(example.data.MT_variants_informative, paste0(location, "result_", filename, ".rds"))
write.table(example.data.MT_variants_informative, paste0(location, "result_", filename, ".txt"), sep="\t")
输出文件时可能需要新建文件夹,可以采用dir.create()函数进行。
在指定的output路径中输出文件,就可以简单的完成R脚本的功能啦。之后我们再去Linux终端检查一下。首先查看一下是否有帮助文档:
Rscript test.R -h #or --help
之后尝试一下执行这个R脚本。由于参数比较多我另写了一个bash脚本去执行,这样在进程出现问题时也比较方便进行进程管理。(在其他的回答中也有看到直接进行r脚本运行的,类似#!/usr/lib/R/bin/Rscript --vanilla作为脚本第一行这样,但我还没有尝试过)
#!/bin/bash
Rscript test.R -i $input_file -o $output_file -s $sample_name
# just an example:)
将脚本挂在后台之后检查一下自己输出的log文件,判断一下是否正常运行。
参考回答:
R 学习笔记:文件和目录操作 - 知乎 (zhihu.com)
linux下运行r脚本_linux系统提交r脚本运行-CSDN博客
如何在Linux上编写和使用R脚本 - 简书 (jianshu.com)