多基因风险预测模型2--相关概念和软件

计算PRS时,设计到的概念和常用的软件,这里整理一下。

1. PRS和GRS

PRS,polygenic risk score,多基因风险评分
GRS,genetic risk score,遗传风险评分

目前,一般用PRS,因为我们在预测风险评分时,用到的是多基因的模型。

2,impute4

填充软件,现在最新版本是impute5

官网:https://jmarchini.org/software/#impute-5

软件下载地址:https://www.dropbox.com/sh/mwnceyhir8yze2j/AADbzP6QuAFPrj0Z9_I1RSmla?dl=0


介绍:

IMPUTE 5 is a genotype imputation method that can scale to reference panels with millions of samples. This method continues to refine the observation made in the IMPUTE2 method, that accuracy is optimized via use of a custom subset of haplotypes when imputing each individual. It achieves fast, accurate, and memory-efficient imputation by selecting haplotypes using the Positional Burrows Wheeler Transform (PBWT). By using the PBWT data structure at genotyped markers, IMPUTE 5 identifies locally best matching haplotypes and long identical by state segments. The method then uses the selected haplotypes as conditioning states within the IMPUTE model.
IMPUTE5 is up to 30x faster than MINIMAC4 and up to 3x faster than BEAGLE5.1

3. plink2

plink目前应用比较广泛的两个版本:

  • 1.9
  • 2.0

plink1.9下载地址:https://www.cog-genomics.org/plink/
在这里插入图片描述
plink2.0下载地址:https://www.cog-genomics.org/plink/2.0/

目前,我使用的是1.9版本,看来也要学习2.0的使用方法了,数据量大时2.0更快,而且功能更强大,不过语法有所变化。

4. rstpm2R包

R包:rstpm2,主要用于进行柔性参数生存模型,计算不同因素的结果,然后进行绘图。

5. 多基因风险评分PRS依赖的因素

第一个:个体的遗传变异。这部分是通过基因检测比如重测序、芯片得到的基因分型,就是SNP信息。

第二个:遗传变异效应值。这部分是通过GWAS分析得到的BETA或者OR值,就是不同分型的效应值。

我们可以将第一部分SNP的分型值(比如0-1-2),乘以SNP的效应值(比如-0.2)得到一个位点的得分,将多个位点的值累加,就是PGS。

6. PRSice-2软件

下一节介绍这个软件的安装及使用方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值