图形化开放式生信分析系统开发 - 4 生信分析流程图形化设计

前文链接:

在上文图形化开放式生信分析系统开发 - 3 生信分析pipeline的进化 讨论了生信分析流程的进化,从手动到自动,但仍然停留在终端命令行阶段,为了让更多非生信专业的人能够使用,就要想办法实现生信分析pipeline的图形化:提供能够快速上手的UI,简单点击鼠标就能够运行的图形化系统。

核心功能:pipeline的图形化工作流设计器

软件获取:官网sliverworkspace.com免费下载个人版,最新版本 2.0.277363

变量处理:要实现pipeline图形设计器,首先要先对用到的变量,做统一的设计。

1. 变量的分类: 根据实际经验,pipeline变量用到根据用途可以分为以下几类:

  1. 分析数据目录 d a t a 分 析 过 程 输 出 目 录 {data} 分析过程输出目录 data{result}
  2. 分析用到的软件 bwa ${tools.bwa};samtools ${tools.samtools}
  3. 分析流程中用的reference文件以及数据库,如 hg19.fa ${ref.hg19}
  4. 分析流程中,用到的cutoff值. 如 cnv的cutoff值 ${cutoff.cnv}
  5. 分析流程运行时配置的资源,如 线程数 t h r e a d s 分 配 内 存 大 小 {threads} 分配内存大小 threads{mem}

2. 变量值的类型:

  1. 字符:通用的格式,比较宽松
  2. 程序:校验变量值时,判断文件是否存在,是否有可执行权限
  3. 文件:校验变量值时,判断文件是否存在,是否有读写权限
  4. 目录:校验变量时,判断目录是否存在,是否有读写权限
  5. 数值:校验变量时,判断是否为数值格式

最终设计数据好数据结构,做好增删改查功能,UI如下:
在这里插入图片描述

分析步骤/节点设计:前文提到,生信分析pipeline其实就是基于文件输入输出的工作流,这里对工作流做了简化,归纳起来工作流中有4种节点。

  1. Input节点,提供pipeline的起始输入文件
    在这里插入图片描述
    在这里插入图片描述
  2. Output节点,获取pipeline的最终输出文件
    在这里插入图片描述
    在这里插入图片描述
  3. Task节点,输入文件,运行分析过程,输出分析过程运行结果
    在这里插入图片描述
    在这里插入图片描述
  4. Database节点,部分pipeline运行结果,需要将输出文件保存至系统数据库中
    在这里插入图片描述
    在这里插入图片描述

工作流设计: 最后,有了变量,和节点,最后就是工作流的设计了。用连接线,将以上4中节点连接起来,计算相互之间的依赖关系,用统一的格式保存起来。

设计器功能增强:

  1. 当分析节点没有相互连接时候,要提示错误
    在这里插入图片描述
  2. 修正Start的错误后,重新验证状态时:
    在这里插入图片描述
  3. 在Task任务中选择Start输入的文件,并填写好输出文件后:保存时提示,没有运行的命令:
    在这里插入图片描述
    在这里插入图片描述
  4. 在Task中输入运行的命令,可以看到:变量提供了语法着色显示,防止输错
    在这里插入图片描述
  5. 最终满足校验要求后,工作流是这样的:
    在这里插入图片描述

最后上一张,完成了的工作流设计器:
在这里插入图片描述

您可以下载PPT或加QQ群:853718264讨论

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值