从医学统计学关联到因果关系
随机对照实验是医学研究的金标准,但是开展难度较大。孟德尔遗传的证据等级介于队列研究和随机对照研究之间。
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/a27c64c4e0a647bc95f61843e67a85cf.png
孟德尔随机化的原理:用基因型(SNP)作为工具变量,来研究中间表型和疾病之间的关联性。
孟德尔随机化例子
基因型SLC2A9与尿酸有关(基于文献),同时SLC2A9也与缺血性心脏病有关(基于文献)。该基因型与年龄、性别等混杂因素无关。借助这个模型就可以研究尿酸与缺血性心脏病的关系。
孟德尔随机化的步骤为:
①找工具变量,从其他研究中挑选特定基因作为工具变量,从基因库中挑选需要的和暴露相关的基因变量SNPs。
②估计工具变量对结局的作用,工具变量对结局的作用也是从所有的研究中估计出来的整体效应,这样可以拒绝单个研究的偏倚。
③合并多个SNP的效应量,效应量是得到暴露和结局因果效应的前提。
④用合并后的数据进行孟德尔随机化分析和相应的敏感性分析。
孟德尔随机化的统计方法包括:
①逆方差加权法(inverse variance weighted.Ivw):IVW是MR在分析多个SNP时对多个位点效应进行Meta汇总的方法。IVW的应用前提是所有的SNP均为有效的工具变量且相互之间完全独立。
②加权中位数估计(Weighted median,WM):WM为所有的个体SNP效应值按照权重排序后得到的分布函数的中位数。当至少50%的信息来自于有效的工具变量时,WM可得到稳健的估计值。
③MR-Egger法:MR-Egger不强制回归直线通过原点,允许纳入的工具变量存在定向的基因多效性。当回归截距不为零且P for intercept <0.05时表明基因多效性的存在。
④MR-PRESSO法:可以通过排除异常值(outliers)排除特定的SNP以获得更加接近真实值的估计值。