polygenic risk score:多基因风险评分

欢迎关注”生信修炼手册”!

针对复杂疾病,通过GWAS研究可以识别到大量的疾病易感位点,然而这些位点绝大多数都属于微效位点,单个或者少数几个位点对疾病的效应较弱,无法准确的预测疾病。为了更好的研究患病风险,我们需要综合多基因位点的信息。在这个基础上,提出了多基因风险评分的概念。

多基因风险评分,对应的英文如下

polygenic risk score

简称PRS, 计算公式如下

其中i表示SNP位点,m表示SNP位点的总数,β表示该SNP位点对于疾病的效应,j表示该SNP位点的基因型,分别用0,1,2表征没有突变,杂合突变和纯合突变,ω表示每种基因型的频率。从公式可以看出,PRS值是所有疾病相关位点效应值的总和。在计算PRS时,有以下两个关键步骤

  1. SNP位点的选择,采用GWAS分析的p值作为阈值来筛选SNP位点,通常会有多个阈值

  2. SNP位点权重的计算,常用OR值或者回归分析的beta值作为SNP位点对疾病效应的权重

PRS结合了所有疾病关联位点的效应值,更加适合预测个体的患病风险,在实际分析中,计算PRS的流程如下

首先将数据集分为两个部分,base data和target data。其中base data提供了GWAS分析的结果,如p值,beta或者OR值等,用于构建模型;而target data提供了部分样本的基因型和表型数据,用基于base data构建的模型来预测这部分样本的患病风险。

在建模之前,需要对数据进行质控,可以参考GWAS的质控标准。同时还需要注意,两个数据集的样本必须是独立的,不存在重复样本,即一个样本不能同时出现在base data和target data中。接下来计算PRS, 需要考虑连锁不平衡的调整,beta收缩,pvalue阈值选取等因素,然后计算PRS值,并进行PRS和表型之间的关联分析,最后使用两个数据集进行交叉验证。

可以进行PRS分析的软件有很多,PRSice是使用的最为广泛的一款。在后续会详细介绍其用法。

·end·

—如果喜欢,快分享给你的朋友们吧—

往期精彩

  GWAS meta分析

  基因型填充

  CNV分析

  • 1
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基因适应(Polygenic adaptation)是指一种遗传学现象,即在自然选择的作用下,多个基因同时发生变异,以适应环境的改变。多基因适应的检测方法可以分为两类:基于基因组数据的方法和基于表型数据的方法。 1. 基于基因组数据的方法 基于基因组数据的多基因适应检测方法,利用整个基因组的变异信息来确定与环境适应相关的基因。 (1)FST分析:FST是一种基于多态性分析的方法,用于比较不同人群间的基因型和等位基因频率差异。在多基因适应研究中,可以使用FST来比较不同生态环境下的群体,确定与环境适应相关的位点。 (2)基因组关联研究(GWAS):GWAS是一种可以检测基因与表型之间关联性的方法。在多基因适应研究中,通过GWAS可以检测与环境适应相关的基因型和等位基因频率。 (3)选择扫描:选择扫描是一种基于多态性变异的方法,通过比较群体间的遗传差异来确定与环境适应相关的基因。选择扫描方法可以检测整个基因组中的单个位点或基因。 2. 基于表型数据的方法 基于表型数据的多基因适应检测方法,将基因型和表型数据结合起来,通过比较在不同环境下表现出不同表型的个体,来确定与环境适应相关的基因。 (1)QST-FST比较:QST-FST比较是一种基于表型和基因型的比较方法,用于比较不同群体间的表型和基因型变异。通过比较QST和FST之间的差异,可以确定与环境适应相关的基因。 (2)环境关联分析:环境关联分析是一种基于表型数据的多基因适应检测方法,通过比较个体在不同环境下的表现,来确定与环境适应相关的基因。 以上方法各有优缺点,结合使用可以提高多基因适应的检测效率和准确性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值