根据染色体提取vcf中的信息:
bcftools view -r chr20,chr21,chr22 NA12878.vcf.gz -o NA12878.vcf.chr20_22.gz -O z
解释:
- 提取金标准变异NA12878.vcf.gz中20、21和22染色体的变异,保存到NA12878.vcf.chr20_22.gz文件中
- -O z:表示使用压缩形式保存文件
提取之后的文件作为其它软件输入时经常需要索引,可按如下建立索引:
bcftools index -t NA12878.vcf.chr20_22.gz
解释:
- -t:产生TBI格式的索引(如果没有-t选项,默认会产生csi的索引)
- 命令结束后会产生NA12878.vcf.chr20_22.gz.tbi的索引文件