GATK-SV 项目使用教程

GATK-SV 项目使用教程

gatk-svA structural variation pipeline for short-read sequencing项目地址:https://gitcode.com/gh_mirrors/ga/gatk-sv

1. 项目的目录结构及介绍

GATK-SV 项目的目录结构如下:

/src: 主流程脚本
/RdTest: 深度测试脚本
/sv-pipeline: 流程中使用的各种脚本和包
/svqc: 用于检查流程指标是否在可接受范围内的 Python 模块
/svtest: 用于从模块输出生成各种汇总指标的 Python 模块
/svtk: 用于 SV 相关数据文件解析和分析的 Python 模块
/WGD: 全基因组剂量评分脚本

2. 项目的启动文件介绍

项目的启动文件主要位于 /src 目录下,这些脚本是整个流程的核心部分,负责协调各个模块的执行。

3. 项目的配置文件介绍

项目的配置文件主要包括 Cromwell 的配置文件和 WDL 文件。Cromwell 配置文件用于定义工作流的执行选项,而 WDL 文件则定义了具体的工作流步骤和输入输出。

Cromwell 配置文件

Cromwell 配置文件通常命名为 cromwell_config.json,它包含了工作流的执行选项,例如 Google Cloud 项目 ID、Terra 计费项目 ID 等。

WDL 文件

WDL 文件定义了具体的工作流步骤和输入输出。例如,GATKSVPipelineBatch.wdl 文件定义了批处理工作流的步骤。

# GATK-SV 项目使用教程

## 1. 项目的目录结构及介绍

GATK-SV 项目的目录结构如下:

/src: 主流程脚本 /RdTest: 深度测试脚本 /sv-pipeline: 流程中使用的各种脚本和包 /svqc: 用于检查流程指标是否在可接受范围内的 Python 模块 /svtest: 用于从模块输出生成各种汇总指标的 Python 模块 /svtk: 用于 SV 相关数据文件解析和分析的 Python 模块 /WGD: 全基因组剂量评分脚本


## 2. 项目的启动文件介绍

项目的启动文件主要位于 `/src` 目录下,这些脚本是整个流程的核心部分,负责协调各个模块的执行。

## 3. 项目的配置文件介绍

项目的配置文件主要包括 Cromwell 的配置文件和 WDL 文件。Cromwell 配置文件用于定义工作流的执行选项,而 WDL 文件则定义了具体的工作流步骤和输入输出。

### Cromwell 配置文件

Cromwell 配置文件通常命名为 `cromwell_config.json`,它包含了工作流的执行选项,例如 Google Cloud 项目 ID、Terra 计费项目 ID 等。

### WDL 文件

WDL 文件定义了具体的工作流步骤和输入输出。例如,`GATKSVPipelineBatch.wdl` 文件定义了批处理工作流的步骤。

gatk-svA structural variation pipeline for short-read sequencing项目地址:https://gitcode.com/gh_mirrors/ga/gatk-sv

使用GATK的combinegvcf模块合并gvcf文件,可是到了这一步Using GATK jar /stor9000/apps/users/NWSUAF/2022050434/biosoft/gatk4.3/gatk-4.3.0.0/gatk-package-4.3.0.0-local.jar Running: java -Dsamjdk.use_async_io_read_samtools=false -Dsamjdk.use_async_io_write_samtools=true -Dsamjdk.use_async_io_write_tribble=false -Dsamjdk.compression_level=2 -jar /stor9000/apps/users/NWSUAF/2022050434/biosoft/gatk4.3/gatk-4.3.0.0/gatk-package-4.3.0.0-local.jar CombineGVCFs -R /stor9000/apps/users/NWSUAF/2008115251/genomes/ARS-UCD1.2_Btau5.0.1Y.fa --variant /stor9000/apps/users/NWSUAF/2020055419/home/xncattle/03.GVCF/01_out_GVCF/XN_22/1_XN_22.g.vcf.gz --variant /stor9000/apps/users/NWSUAF/2020055419/home/xncattle/03.GVCF/01_out_GVCF/XN_18/1_XN_18.g.vcf.gz -O /stor9000/apps/users/NWSUAF/2022050469/candy/bwa/gatk/Combine/chr1.g.vcf.gz 09:10:40.524 INFO NativeLibraryLoader - Loading libgkl_compression.so from jar:file:/stor9000/apps/users/NWSUAF/2022050434/biosoft/gatk4.3/gatk-4.3.0.0/gatk-package-4.3.0.0-local.jar!/com/intel/gkl/native/libgkl_compression.so 09:10:50.696 INFO CombineGVCFs - ------------------------------------------------------------ 09:10:50.697 INFO CombineGVCFs - The Genome Analysis Toolkit (GATK) v4.3.0.0 09:10:50.697 INFO CombineGVCFs - For support and documentation go to https://software.broadinstitute.org/gatk/ 09:10:50.698 INFO CombineGVCFs - Executing as 2022050469@node54 on Linux v3.10.0-1127.el7.x86_64 amd64 09:10:50.698 INFO CombineGVCFs - Java runtime: Java HotSpot(TM) 64-Bit Server VM v1.8.0_72-b15 09:10:50.698 INFO CombineGVCFs - Start Date/Time: July 21, 2023 9:10:40 AM CST 09:10:50.698 INFO CombineGVCFs - ------------------------------------------------------------ 09:10:50.698 INFO CombineGVCFs - ------------------------------------------------------------ 09:10:50.698 INFO CombineGVCFs - HTSJDK Version: 3.0.1 09:10:50.699 INFO CombineGVCFs - Picard Version: 2.27.5 09:10:50.699 INFO CombineGVCFs - Built for Spark Version: 2.4.5 09:10:50.699 INFO CombineGVCFs - HTSJDK Defaults.COMPRESSION_LEVEL : 2 09:10:50.699 INFO CombineGVCFs - HTSJDK Defa就停止了,没有输出文件,也没有报错文件
07-22
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

蓬玮剑

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值