孟德尔随机化
文章平均质量分 73
天桥下的卖艺者
4个R包的编写者。发布关于SPSS、R语言、stata等相关科研的文章。今后的方向聚焦于:1.机器学习和深度学习 2.各种模型算法研究 3.各种科研图形绘制 4.R语言编程和R包编写 5.数据挖掘
展开
-
代码+视频,R语言forestploter包优雅的绘制孟德尔随机化研究森林图
我们今天来做个上图这样的森林图,使用的是《R语言复现一篇6分的孟德尔随机化文章》的数据,这篇文章作者直接提供了数据,所以我就直接拿来用了。作者分析了很多精神病和骨密度的结果,这里我就取精神分裂症和骨密度结果来分析。在既往文章中,我们对孟德尔随机化研究做了一个简单的介绍。我们可以发现,使用TwoSampleMR包做出来的森林图并不是很美观。今天我们使用R语言forestploter包优雅的绘制孟德尔随机化研究森林图。使用TwoSampleMR包做出来的森林图是这样的。而很多SCI文章中的森林图是这样的。原创 2024-01-26 08:58:37 · 1790 阅读 · 0 评论 -
R语言进行孟德尔随机化+meta分析(2)----基于R和stata
一共纳入了385篇文章。这里我们要注意一下,循环系统是有很多疾病的,就拿心房颤动这个疾病来说,作者的数据很多很大,他是把GWAS meta-analysis、FinnGen这2个数据库的结果进行相加,再来做meta分析,如果你的数据没有这么大,你把每个数据库先分别做,然后再汇总也是可以的。整个过程处理起来还是挺花时间的,毕竟要一篇篇的读,提取数据。接下来就是作者的两个主表了,表2是开始吸烟的人的疾病分析,表3是终生吸烟的人的疾病分析,作者就是根据这两个表来做meta分析的,下面我把数据提取出来跑一下。原创 2023-09-28 09:14:44 · 3575 阅读 · 1 评论 -
R语言进行孟德尔随机化+meta分析(1)---meta分析基础
咱们先来看下函数格式event.e就是实验组阳性人数,n.e,实验组总人数,event.c对照组阳性人数,n.c对照组总人数,data就是你的数据,studlab填入其他的项目,method这里选"Inverse"倒方差的方法就可以了,sm这里填入结果类型,如果你需要的是OR的结果就填入OR。这是一个很简单的数据,stud表示研究名称,a为实验组阳性人数,b为实验组总人数,c为对照组阳性人数,d为对照组总人数(公众号回复:森林图数据1,可以获得数据)。先生成meta分析结果,就按顺序把结果填进去就可以了。原创 2023-09-21 09:38:24 · 4251 阅读 · 0 评论 -
改良版自编小程序上线啦---助力孟德尔随机化(Mendelian Randomization)数据挖掘
我这次特地设置复杂点,假设我们研究的想研究的原因变量有3个"ieu-a-22",“prot-b-66”,“ukb-b-15590”,想研究的结局变量有3个"finn-b-O15_MEMBR_PREMAT_RUPT",“ukb-b-12621”,“finn-b-O15_PLAC_PREMAT_SEPAR”",如果我们一个一个的做也是要花费一定时间的,如果变量更多就需要更多时间了。这样就结果就生成啦,我们可以看到每个暴露变量和结果变量匹配的情况,看出有没有意义,对于大规模变量的筛选我个人认为还是有帮助的。原创 2023-08-15 10:17:03 · 591 阅读 · 0 评论 -
复现一篇16分的孟德尔随机化文章
作者分析了两个指标,一个是吸烟指数、第二个是每周饮酒量,对这两个指标进行多变量分析,多变量孟德尔随机化考虑了两个变量的相互影响,简单来说可以把另外的当做混杂因素。最后我个人总结一下自己的看法,孟德尔随机化分析要想发高分,主要还是在前期自己大量的数据收集和汇总,代码不是很难,一定要像文章中做多个数据库的,最好同时做单变量和多变量的。这是一篇老外的文章,咱们试着复现一下文章的数据和图表,和上一篇一样,作者和上一篇一样也是给咱们提供了详尽的数据和R的代码,我们可以跟着作者的思路进行一个复盘。原创 2023-08-08 09:03:58 · 7051 阅读 · 7 评论 -
R语言forestploter包优雅的绘制孟德尔随机化研究森林图
我们还需调整一下,还有个问题就是95%CI这里的上线区间和下限区间是连在一起的,我们要把它分开提取出来,需要用到一点点非常简单的正则式小知识。我们今天来做个上图这样的森林图,使用的是《R语言复现一篇6分的孟德尔随机化文章》的数据,这篇文章作者直接提供了数据,所以我就直接拿来用了。文章作者制作的这个表格非常整齐,我们提取需要使用str_sub函数,这个函数使用非常简单,你想提取什么内容,输入它的位置就可以了,下限low是1-5位置,这里要注意一下,小数点也占一个位置。而很多SCI文章中的森林图是这样的。原创 2023-07-14 13:59:02 · 12103 阅读 · 16 评论 -
自编R语言小程序助力孟德尔随机化(Mendelian Randomization)数据挖掘
假设我们研究的想研究的原因变量有两个"ieu-a-22",“prot-b-66”,想研究的结局变量有3个"finn-b-O15_MEMBR_PREMAT_RUPT",“ukb-b-12621”,“finn-b-O15_PLAC_PREMAT_SEPAR”,如果我们一个一个的做也是要花费一定时间的,如果变量更多就需要更多时间了。然而这个函数也是有部分缺点的,第一就是它是通过在线下载数据,如果你的网络不行,下载不到数据,它就会报错,所以因在网络比较好的时候进行(如白天)。然后生成结果,非常简单吧。原创 2023-07-05 09:03:01 · 1904 阅读 · 0 评论 -
R语言复现一篇6分的孟德尔随机化文章
最后总结一下,咱们对作者的文章部分结果进行了复盘(自己提取数据和使用作者提供的数据),虽然数据和代码都对得上,结论也是正确的,但是OR和P值和原作者有轻微差别,我觉得本次对数据和方法还有结果是没有问题的,我大胆猜一下,有没有一种可能是作者数据太多,贴错了。最后这个是生成OR和可信区间,我们可以看到虽然P值不一样,但是OR和可信区间非常接近,表明咱们的方法应该基本上是没啥问题的,毕竟数据和作者的一致,又是使用作者给的代码。但是算出来和作者的不一样,我的OR和可信区间这里没有转换,但是我对照了P值不一样。原创 2023-06-28 09:17:28 · 6766 阅读 · 8 评论 -
一起来学孟德尔随机化(Mendelian Randomization)
我们通过TwoSampleMR包把它下载,先使用extract_instruments函数对暴露数据(就是体重BMI的SNP数据)ieu-a-835进行下载,如果是已经下载到电脑里面的数据,我们使用read_exposure_data函数和clump_data函数读取。这三步走完就可以进行MR分析了,代码非常简单。孟德尔随机化(Mendelian randomization,简称MR)是一种基于遗传变异的因果推断方法,其基本原理是利用自然界中的随机分配的基因型对表型的影响来推断生物学因素对疾病的影响。原创 2023-06-24 16:28:18 · 32908 阅读 · 5 评论