参考资料来源:
http://zzz.bwh.harvard.edu/plink/data.shtml#tr
plink常用格式:PED/MAP
PED文件:包含每个样本的基本信息(族系、名称、性别等)、表现型信息(phenotype)、这个样本所含的所有SNPs位点的信息(第7列之后)。每行表示一个样本。
具体列数取决于该样本所含SNPs位点数
前六列,每列信息如下:
Family ID
Individual ID
Paternal ID
Maternal ID
Sex (1=male; 2=female; other=unknown)
Phenotype
其中:
Family ID:族系ID
Individual ID:个体(如样本间无族系联系,Family ID和Individual ID可以一样)
Paternal ID:父系ID,未知可为0
Maternal ID:母系ID,未知可为0
Sex:性别 (1=male; 2=female; other=unknown)
Phenotype:每个ped文件有且只有一列是phenotype
从第七列开始,每两列代表该样本所含的一个SNP的基因型:
如:第七、八列代表第一个基因型,第九、十列代表第二个基因型等等
PED文件举例:
FAM001 1 0 0 1