有很多概念需要明确区分:
人有23对染色体,其中22对常染色体autosome,另外一对为性染色体sex chromosome,XX为女,XY为男。
染色体区带命名:在标示一特定的带时需要包括4项:①染色体号;②臂的符号;③区号;④在该区内的带号。
1p22表示为1号染色体短臂2区2带。
等位基因其实是一个集合,在同一个locus出现得基因型互为等位基因。Aa不能叫等位基因,正确的逻辑是:A和a是一组等位基因。由等位基因可以定义纯合和杂合。
二倍体与多倍体细胞的某些染色体上,在同一基因座上有相同的等位基因,这类细胞称为纯合子/同型合子(homozygous)。若是相同基因座上含有不同的等位基因,则称作杂合子/异型合子(heterozygous)。
summary statistic顾名思义,就和R里面的summary函数一样,是对GWAS数据的一个概括总结,包含了结果中最核心的信息。
ebi也提供了很多GWAS研究summary statistic的结果下载,https://www.ebi.ac.uk/gwas/summary-statistics
GWAS的基本原理
如何跑GWAS?
Power
Effect size
Major allele,
Minor allele,
Minor allele frequency (MAF),
Missingness per genotype,
Missingness per individuals,
metrics that we look at include
linkage disequilibrium (LD),
variance inflation factor (VIF),
runs of homozygosity (ROH),
These provide a broad 'summary' of the data and allow us to appropriately set threshold