使用PRSice进行多基因风险评分分析

本文介绍了PRSice软件在多基因风险评分分析中的应用,包括其工作原理、安装过程、基本用法及参数设置。PRSice通过一系列P值阈值计算PRS值,选择最佳阈值以减少假阳性和假阴性。软件输出多个文件,提供不同阈值的分析结果,可用于选择最佳阈值和评估表型关联。同时,文章提到了软件对协变量校正的支持和关键结果的可视化方式。
摘要由CSDN通过智能技术生成

欢迎关注”生信修炼手册”!

PRSice是最常用的多基因风险评分软件之一,目前最新版本为v2, 官网如下

https://www.prsice.info/

该软件计算样本PRS值的公式如下

计算PRS值时有两个关键点,第一个是SNP位点的筛选,在上述公式中,Pt表示的是GWAS结果中P值的阈值,挑选P值小于该阈值的SNP位点进行PRS的计算;第二个是SNP位点对表型效应的度量,这里用β表示,可以是OR值或者回归系数beta值。

在筛选SNP位点时,单一的阈值不可避免会出现假阳性和假阴性的问题,阈值太小,很多阳性的位点会因为P值不达标被过滤掉, 导致假阴性;阈值太大,很多阴性的位点也会被包括进来,导致假阳性,这些都会对最终的分析结果造成影响。

为了解决这一问题,PRSice使用一系列Pvalue的阈值进行分析,针对不同的阈值计算PRS值,然后根据PRS值和表型关联分析的结果来挑选最佳的阈值。

该软件的安装过程如下

wget https://github.com/choishingwan/PRSice/releases/download/2.2.11/PRSice_linux.nightly.zip
unzip PRSice_linux.nightly.zip

解压缩后的文件如下

其中PRSice_linux是该软件的执行脚本,PRSice.R是对执行脚本的封装,TOY开头的是软件自带的数据集,用于测试,其中分为了BASETARGET两个部分。

基本用法如下

通过R脚本来调用该软件,dir参数指定R包ggplot2安装的路径,因为结果展示会调用ggplot2进行可视化,如果已经安装了这个包,这个参数可以不要; prsice参数指定可执行文件的路径;base参数指定base data的关联分析结果,target参数指定target data的分型结果,thread参数指定线程数;stat指定base data关联分析结果中的效应值,有OR和BETA两种取值;binary-target参数指定target data中分型结果是否为二分类的表型。

base data关联分析结果的内容示意如下

需要注意的是,软件通过表头来识别对应的信息,上述表头是默认的,比如CHR代表SNP位点所在的染色体,如果你的结果中不叫CHR, 比如是CHROM, 那么需要修改软件的参数,让软件知道代表染色体的列名是什么。

该软件的输出结果有多个文件,示意如下

PRSice.prsice记录了不同阈值下的分析结果,内容示意如下

PRSice.summary记录了最佳阈值的分析结果, 内容示意如下

PRSice.best记录了target data中样本的PRS值,内容示意如下

BARPLOT.png以柱状图的形式展示了不同阈值得到的关联结果对应的R2分布,结果示意如下

HIGH-RES_PLOT.png以折线图的形式展示了不同阈值得到的关联结果对应的P值分布,结果示意如下

P值最小的点对应的就是最佳的阈值,无论是柱状图还是折线图,只需要y轴最大的点对应的横坐标即可。该软件在进行PRS值和表型的关联分析时,还支持协变量的校正,只需要添加cov参数即可,更多用法请参考官方文档。

·end·

—如果喜欢,快分享给你的朋友们吧—

往期精彩

  GWAS meta分析

  基因型填充

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值