一、什么是多基因风险评分
传统的GWAS研究只计算单个SNP位点与表型之间的关联性,再用Bonferroni校正,通过给定的阈值,筛选出显著的SNP位点。
这样会存在两个问题,第一、Bonferroni校正非常严格,很多对表型也有贡献的位点会因为达不到阈值而被过滤掉。第二、单个位点对表型的解释度是很低的,尤其是对于高血压这种多基因控制的表型,用一个个单独的位点解释高血压患病风险,就显得很单薄。
因此,开发一个能让我们直观的感受,患某种疾病的风险多高的工具,显然是非常有必要的。
为了更好理解多基因风险得分(PRS)的概念,我画了一个图,假如翠花的多基因风险评分处于第二个柱形图那里,那么我们就会认为翠花得某种疾病的风险比普通人要低。
二、多基因风险得分的公式
多基因风险得分的公式如下:
PT表示P值的阈值;
i表示符合该阈值下的SNP的数量,i = 1, 2, ..., m;
βi表示SNP的效应值,在GWAS当中,如果是线性表型,该值为β,如果是二元表型,该值为OR;
Gi,j 表