GATK-SV 项目使用指南

GATK-SV 项目使用指南

gatk-svA structural variation pipeline for short-read sequencing项目地址:https://gitcode.com/gh_mirrors/ga/gatk-sv

1、项目介绍

GATK-SV 是由 Broad Institute 开发的一个用于结构变异(Structural Variants, SVs)检测的生物信息学管道。该项目基于 GATK 工具集,利用大规模并行化技术在云平台上进行高效的基因组数据分析。GATK-SV 支持多种数据处理和分析任务,包括但不限于 CNV 检测、SV 鉴定和基因组变异注释。

2、项目快速启动

环境准备

在开始之前,请确保您已经安装了以下工具和依赖:

  • Cromwell(v36 或更高版本)
  • Docker 或 Singularity(如果您的集群不支持 Docker)
  • Git

克隆项目

首先,克隆 GATK-SV 仓库到本地:

git clone https://github.com/broadinstitute/gatk-sv.git
cd gatk-sv

配置和运行

  1. 创建运行目录并复制必要的文件:
mkdir gatksv_run && cd gatksv_run
mkdir wdl && cd wdl
cp $GATK_SV_ROOT/wdl/* wdl
zip dep.zip *wdl
cd ..
  1. 配置输入文件:
echo '["google_project_id": "my-google-project-id", "terra_billing_project_id": "my-terra-billing-project"]' > inputs/values/google_cloud_my_project.json
bash scripts/inputs/build_default_inputs.sh -d $GATK_SV_ROOT -c google_cloud_my_project
  1. 提交任务:
cp $GATK_SV_ROOT/inputs/build/ref_panel_1kg/test/GATKSVPipelineBatch/GATKSVPipelineBatch_my_run.json .
cromshell submit wdl/GATKSVPipelineBatch.wdl GATKSVPipelineBatch_my_run.json cromwell_config.json wdl/dep.zip

3、应用案例和最佳实践

案例一:CNV 检测

GATK-SV 可以用于检测基因组中的拷贝数变异(CNVs)。通过训练 gCNV 模型,结合单样本的证据,可以准确地识别和注释 CNV 事件。

案例二:SV 鉴定

利用 GATK-SV 管道,可以对大规模的基因组数据进行结构变异鉴定。通过整合多种 SV 检测工具的结果,GATK-SV 能够提供高质量的 SV 鉴定和注释。

最佳实践

  • 确保输入数据的质���,使用高质量的测序数据可以显著提高 SV 检测的准确性。
  • 对于大规模的分析任务,建议使用支持 Docker 或 Singularity 的计算环境,以确保计算资源的有效利用。

4、典型生态项目

Cromwell

Cromwell 是一个支持 Workflow Description Language (WDL) 的工作流执行系统,广泛用于生物信息学领域的数据处理和分析任务。GATK-SV 利用 Cromwell 进行任务调度和管理,确保复杂分析任务的高效执行。

Terra

Terra 是一个基于云的生物信息学分析平台,提供了丰富的工具和资源,支持大规模基因组数据的分析和共享。GATK-SV 可以在 Terra 平台上进行部署和执行,利用其强大的计算和存储资源。

通过以上模块的介绍和实践,您可以快速上手并利用 GATK-SV 进行高效的结构变异检测和分析。

gatk-svA structural variation pipeline for short-read sequencing项目地址:https://gitcode.com/gh_mirrors/ga/gatk-sv

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
使用GATK的combinegvcf模块合并gvcf文件,可是到了这一步Using GATK jar /stor9000/apps/users/NWSUAF/2022050434/biosoft/gatk4.3/gatk-4.3.0.0/gatk-package-4.3.0.0-local.jar Running: java -Dsamjdk.use_async_io_read_samtools=false -Dsamjdk.use_async_io_write_samtools=true -Dsamjdk.use_async_io_write_tribble=false -Dsamjdk.compression_level=2 -jar /stor9000/apps/users/NWSUAF/2022050434/biosoft/gatk4.3/gatk-4.3.0.0/gatk-package-4.3.0.0-local.jar CombineGVCFs -R /stor9000/apps/users/NWSUAF/2008115251/genomes/ARS-UCD1.2_Btau5.0.1Y.fa --variant /stor9000/apps/users/NWSUAF/2020055419/home/xncattle/03.GVCF/01_out_GVCF/XN_22/1_XN_22.g.vcf.gz --variant /stor9000/apps/users/NWSUAF/2020055419/home/xncattle/03.GVCF/01_out_GVCF/XN_18/1_XN_18.g.vcf.gz -O /stor9000/apps/users/NWSUAF/2022050469/candy/bwa/gatk/Combine/chr1.g.vcf.gz 09:10:40.524 INFO NativeLibraryLoader - Loading libgkl_compression.so from jar:file:/stor9000/apps/users/NWSUAF/2022050434/biosoft/gatk4.3/gatk-4.3.0.0/gatk-package-4.3.0.0-local.jar!/com/intel/gkl/native/libgkl_compression.so 09:10:50.696 INFO CombineGVCFs - ------------------------------------------------------------ 09:10:50.697 INFO CombineGVCFs - The Genome Analysis Toolkit (GATK) v4.3.0.0 09:10:50.697 INFO CombineGVCFs - For support and documentation go to https://software.broadinstitute.org/gatk/ 09:10:50.698 INFO CombineGVCFs - Executing as 2022050469@node54 on Linux v3.10.0-1127.el7.x86_64 amd64 09:10:50.698 INFO CombineGVCFs - Java runtime: Java HotSpot(TM) 64-Bit Server VM v1.8.0_72-b15 09:10:50.698 INFO CombineGVCFs - Start Date/Time: July 21, 2023 9:10:40 AM CST 09:10:50.698 INFO CombineGVCFs - ------------------------------------------------------------ 09:10:50.698 INFO CombineGVCFs - ------------------------------------------------------------ 09:10:50.698 INFO CombineGVCFs - HTSJDK Version: 3.0.1 09:10:50.699 INFO CombineGVCFs - Picard Version: 2.27.5 09:10:50.699 INFO CombineGVCFs - Built for Spark Version: 2.4.5 09:10:50.699 INFO CombineGVCFs - HTSJDK Defaults.COMPRESSION_LEVEL : 2 09:10:50.699 INFO CombineGVCFs - HTSJDK Defa就停止了,没有输出文件,也没有报错文件
07-22
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

周澄诗Flourishing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值