1.1、--make-bed 生成bed、.bim、.fam文件,例如:
plink --file FILENAME --make-bed --out FILENAME
第一个FILENAME的后缀为.ped和.map,生成的第二个FILENAME的后缀为.bed、.bim、.fam
1.2、--make-just-bim与--make-just-fam --make-bed的变体,它只生成一个bim或fam文件
2、--recode 生成map与ped文件,例如
plink --vcf file.vcf --recode --out file
读取file.vcf文件,输出file.ped与file.map
3、--recode vcf-iid 重编译为vcf文件,例如:
plink --bfile binary_fileset --recode vcf-iid --out new_vcf
有binary_fileset.bim、binary_fileset.fam、binary_fileset.bed生成new_vcf.vcf文件
4、--missing 查看文件缺失率
plink --bfile HapMap_3_r3_1 --missing
- 输出两个文件plink.imiss:个体缺失位点的统计;plink.lmiss:单个SNP缺失的个体数
5、--hwe 排除偏离哈代-温伯格平衡的指标,基因分型错误的常见指标也可能表明进化选择。
对于二元性状,建议排除:病例中HWE p值<1e-10以及对照组中<1e-6。不大严格的病例阈值可避免丢弃在选择下与疾病相关的SNP。对于数量性状,推荐HWE p值<1e-6。
6、--maf 仅包括超过MAF阈值的SNP。
7、--mind 排除基因型缺失率高的个体。在此步骤中,低基因型的个体被移除。
8、--geno 排除了大部分受试者中缺失的SNP。在此步骤中,低基因型的SNP被删除。
9、--extract 提取snp位点信息
10、--keep
plink --bfile file --noweb --keep sampleID.txt --recode --make-bed --out sample
其中,sampleID.txt第一列为提取的样本Family ID,第二列为Within-family ID(IID)
同样的,如果是去除样本,则用参数“--remove”
11、--bfile 读取bin、fam、bed文件 --vcf 读取vcf文件 --