PRS和MR
文章平均质量分 80
育种数据分析之放飞自我
个人公众号:育种数据分析之放飞自我
展开
-
孟德尔随机化R包:TwoSampleMR和MR-PRESSO安装
最新的版本为0.6.4(2024-06-12)。该包没有在CRAN中,在github中,可以通过下面命令安装。如果让选择是否更新,可以选择1,全部更新。后面介绍一下这两个包的使用方法。原创 2024-06-12 07:00:57 · 5610 阅读 · 1 评论 -
ldsc python程序安装以及测试
下一章节介绍ldsc的运行教程。貌似python没有配置好。这个bug后面博客更新。原创 2023-06-19 00:39:19 · 2338 阅读 · 2 评论 -
PRSice-2在windows系统安装教程
二进制文件,直接运行即可。核心计算文件,计算PRS。原创 2023-03-13 22:05:11 · 922 阅读 · 2 评论 -
第二篇:Haploview做单倍型教程2--分析教程
大家好,我是邓飞,这里介绍一下如何使用Haploview进行单倍型的分析。今天是第二篇。原创 2023-01-26 09:30:20 · 4861 阅读 · 1 评论 -
plink中的BGEN格式的数据如何用
现代遗传关联研究通常使用数万至数十万个体的数据,这些数据是全基因组数千万标记的基因分型或估算的。基于这些数据的文本表示的传统数据格式(如IMPUTE输出的GEN格式或变量调用格式)有时不太适合这些数据量。事实上,对于简单的程序,解析这些格式所花费的时间可以支配程序执行时间。本页介绍了二进制GEN文件格式(“BGEN”格式),旨在解决这些问题。BGEN是一种稳健的格式,其设计具有特定的混合特性,我们认为这对此类研究很有用。它的目标是用于大型、潜在的遗传数据集。主要功能包括:存储直接输入和输入数据的能力。原创 2022-12-08 19:50:44 · 2594 阅读 · 1 评论 -
PRS中增加PCA 1-10如何操作
PRS就是多基因风险评分模型,它根据GWAS已经挖掘的结果(GWAS结果,gwas summary),然后使用自己的数据,选择合适的位点,进行个体的风险得分预测。收集已有的gwas summary结果整理自己的snp分型和表型数据进行PRS计算。原创 2022-11-13 09:57:32 · 759 阅读 · 0 评论 -
plink如何更新表型数据
大家好,我是邓飞。平时在分析时,也有时候需要将外部准备好的数据,更新到plink数据中。plink有两种格式类型,二进制文件(bed,bim,fam)在fam文件的第六列,文本文件(ped,map)在ped文件的第六列。数据量小时,可以用excel打开,直接手动增加,如果数据量大,就需要编程实现,比如R语言,Perl或者Python。其实,plink自己有一个参数,可以自动更新表型数据,只需要将所要更新的表型数据准备好就行了。下面介绍一下操作流程。原创 2022-11-13 09:30:02 · 3063 阅读 · 0 评论 -
如何使用plink进行二分类性状的GWAS分析并计算PRS得分
这篇博客,用之前GWAS教程中的示例数据,把数据分为Base数据和Target数据,通过plink运行二分类的logistic模型进行GWAS分析,然后通过PRSice-2软件,进行PRS分析。最终,选出最优SNP组合,并计算Target的PRS得分,主要结果如下:最适合的SNP个数是133个,R2位0.232258,P值为0.014上面数据中,个体的PRS为正值,说明风险高,为负值,说明风险低。正文数据使用GWAS分析教程中的数据。原创 2022-10-31 20:00:12 · 3348 阅读 · 2 评论 -
一张图介绍PRS的计算步骤
查看了一下博客和文献,把我的理解总结一下。PRS是多基因风险评分,下面介绍一下它处理的步骤。原创 2022-10-22 18:55:30 · 2606 阅读 · 0 评论 -
PRSice-2软件安装教程
二进制文件,直接运行即可。核心计算文件,计算PRS。Base file,基础文件,可以根据指定a1,a2,maf,beta,bp,chr,pvalue等信息Target file,目标文件,支持plink二进制文件,可以定义表型,maf质控等Dosage,主要是定义运行的资源配置,比如线程、硬盘、内存等(可以省略)Clumping,主要是质控Clumping参数,有默认值(可以省略)Covariates,定义协变量,包括数字协变量和因子协变量。原创 2022-10-21 21:15:21 · 2001 阅读 · 0 评论 -
多基因风险预测模型2--相关概念和软件
计算PRS时,设计到的概念和常用的软件,这里整理一下。原创 2022-10-13 22:01:32 · 1359 阅读 · 0 评论 -
多基因风险预测模型1--先立Flag
在非吸烟者中,高遗传风险人群同样具备筛查价值,建议遗传风险最高的1%人群从62岁起进行肺癌筛查,而对于遗传风险最低的5%人群,当年龄达到74岁时才可达到参考届值。但是动植物现在我都有接触,发现共同点,理解不同点,算是上路了,但是对于人类的数据分析,比如多基因风险预测模型和孟德尔随机化分析,也是朦朦胧胧,学习起来也是倍感吃力,屡次想放弃。综合起来,就是当你的年龄是多少,吸烟量是多少,基因分型的是什么,最后预测你5年患癌症的概率是多少,概率高的话就是高危人群,建议戒烟或者降低吸烟量,定期体检……原创 2022-10-11 19:21:04 · 463 阅读 · 0 评论