Nextflow通过容器来实现可扩展且可重复的数据分析工作流程。它适用于最常见的脚本语言编写的流水线。其流畅的DSL简化了在云和集群上实现和部署复杂并行的生信数据分析流程。
Nextflow设计基于这样的思想:即Linux是数据科学的通用语言。(PS:这也提示我们,做生信为什么要学Linux。)
快速原型设计
Nextflow允许通过简化将许多不同任务组合在一起来编写计算流水线。用户可以重用现有的脚本和工具,而且无需学习新的语言或API就可以开始使用它。
可重复性
Nextflow支持Docker和Singularity容器技术。结合GitHub代码共享平台的集成,这使你能够编写自包含的流水线,管理版本,并快速重现以前的任何配置。
可移植性
Nextflow在流水线逻辑和执行层之间提供了一个抽象层,因此可以在多个平台上执行而无需更改。
它提供了GridEngine、SLURM、LSF、PBS、Moab和HTCondor批处理调