在千人基因组下载了几百个中国人的GVCF文件,每个样本3个G,用CombineGVCFs合并会报错,后来用bcftool挺好的。代码如下
bcftools merge a.g.vcf.gz b.g.vcf.gz -Oz -o merge.vcf.gz
针对多个样本,可用如下代码:
bcftools merge $(for i in `tail -n +2 metadata.txt | cut -f 1 ` ; do echo "${i}.haplotypeCalls.er.raw.vcf.gz " ;done) -Oz -o merge2.vcf.gz &
但是会出现这
[W::bcf_sr_add_reader] No BGZF EOF marker; file 'HG02389.haplotypeCalls.er.raw.vcf.gz' may be truncated
个警告,不知道为什么