gvcf文件与vcf文件

gvcf文件与vcf文件都是vcf文件,不同之处在于gvcf文件会记录更多的信息,这里更多的信息指的是未突变的位点的覆盖情况,从下面的图我们可以直观的看出两者的区别

可以看到,gvcf文件也分两种,一种是-erc gvcf ,另一种是 -erc bp_resolution,这两种gvcf文件的区别在于前一种gvcf文件记录非突变位点的时候,以块的形式来记录,而后一种gvcf文件则是对非突变和突变位点一视同仁,前一种方式是为了有效的压缩文件的行数和大小,对后续的分析没有影响,因此这里推荐使用前一种gvcf文件。

那么为什么要使用gvcf文件而不是vcf文件呢?这里主要的原因在于多个样本的vcf文件进行合并的时候,需要区分./.和0/0的情况,./.是未检出的基因型,而0/0是未突变的基因型,如果仅使用普通的vcf文件进行合并,那么就无法区分这两种情况,进而对合并结果产生偏差。实际上,我们也可以直接将gvcf文件和vcf文件使用bcftools merge进行merge,但是这样拿到的结果会有偏差,因为vcf文件没有未突变的位点的情况。

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
GATK可以用来合并多个个体的gVCF文件,生成一个joint-called VCF文件。下面是基本的合并gVCF文件的命令: ``` gatk CombineGVCFs \ -R reference.fasta \ --variant sample1.g.vcf \ --variant sample2.g.vcf \ -O cohort.g.vcf ``` 其中,`-R`选项指定参考基因组文件,`--variant`选项指定需要合并的gVCF文件,`-O`选项指定输出的joint-called VCF文件。 如果你有多个gVCF文件需要合并,可以将所有的gVCF文件都列出来,例如: ``` gatk CombineGVCFs \ -R reference.fasta \ --variant sample1.g.vcf \ --variant sample2.g.vcf \ --variant sample3.g.vcf \ --variant sample4.g.vcf \ --variant sample5.g.vcf \ -O cohort.g.vcf ``` 如果你的样品数量很多,可以使用GATK4.0版本中新增的`GenomicsDBImport`工具进行导入和合并。该工具可以将gVCF文件导入到一个用于联合调用的GenomicsDB数据库中,并最终生成一个joint-called VCF文件。下面是使用`GenomicsDBImport`工具导入gVCF文件的命令: ``` gatk GenomicsDBImport \ --genomicsdb-workspace-path my_database \ -L interval.bed \ --sample-name-map sample_map.txt \ --tmp-dir=/scratch/tmp \ --reader-threads 5 ``` 其中,`--genomicsdb-workspace-path`选项指定GenomicsDB数据库的路径,`-L`选项指定区间文件,`--sample-name-map`选项指定样品名列表文件,`--tmp-dir`选项指定临时文件夹路径,`--reader-threads`选项指定读取线程数。 最后,我们可以使用`GenotypeGVCFs`工具对GenomicsDB数据库中的gVCF文件进行joint-calling,生成joint-called VCF文件: ``` gatk GenotypeGVCFs \ -R reference.fasta \ -V gendb://my_database \ -O cohort.g.vcf ``` 其中,`-R`选项指定参考基因组文件,`-V`选项指定GenomicsDB数据库路径,`-O`选项指定输出的joint-called VCF文件

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值