首先,下载SHAPEIT.
按照里面的步骤安装完后,将vcf文件进行基因型定相,分四步走。
第一步,将vcf文件转化为plink二进制文件(.bed, .bim, .fam)。
这一步需要用到GATK里的GenomeAnalysisTK工具,见如下命令:
java -Xmx8g -jar GenomeAnalysisTK.jar -T VariantsToBinaryPed -R GRCh37.fa -V file.vcf --metaData sampleID.fam -mgq 0 -bed file.bed -bim file.bim -fam file.fam
注:这里的metaData,输入的fam文件跟plink的fam格式一样,如果你没有fam文件,则需要自己手动生成,第一列和第一列可以都为样本的ID;
FAM files
The fields in a FAM file are
- Family ID
- Sample ID
- Paternal ID
- Maternal ID
- Sex (1=male; 2=female; o