发文新方向:孟德尔随机化+多组学的联合套路模板

汇集六项大型数据集,设定多达五个研究目标,开发代谢组关联研究(MWAS)框架。

年龄相关性黄斑变性(AMD)是导致视力丧失的主要原因,但其潜在致病机制仍不清楚。为了探究代谢物与AMD之间的因果关系,作者进行了一项开创性研究,对六项多祖先和多液体数据进行了大规模综合遗传和代谢组学分析。文章的亮点包括:

1. 首次进行大规模代谢物全基因组关联研究,鉴定血浆和尿液中的mQTL;

2. 通过双样本MR分析揭示了与AMD相关的血浆代谢物;

3. 发现与AMD相关的代谢物富含脂质相关途径;

4. 系统性探索代谢物与AMD亚型及脂质生物标志物的联系。

这项研究不仅为AMD的致病机制提供了新见解,还为生信分析领域的小伙伴们提供了宝贵的学习资源。

今天要给大家分享的文章如下:↓

题目:Integrating genetics and metabolomics from multi-ethnic and multi-fluid data reveals putative mechanisms for age-related macular degeneration

杂志:Cell Reports Medicine 

影响因子:IF=14.3

中科院分区:医学一区

发表时间:2023年7月

一、研究背景

年龄相关性黄斑变性(AMD)是50岁及以上成年人视力丧失的主要原因,全球患病率达8.7%。目前,AMD已被明确为一种复杂的疾病,涉及环境和遗传风险因素的组合。全基因组关联研究(GWAS)已识别出50多个与AMD风险相关的单核苷酸多态性(SNP),并且遗传学研究还发现了一些与AMD易感性相关的脂质和炎症生物标志物。然而,AMD的潜在致病机制仍然不清楚。

二、数据来源

六个大型数据集分别来自以下研究:护士健康研究(NHS)、NHSII、卫生专业人员随访研究(HPFS)、加拿大老龄化纵向研究(CLSA)、芬兰代谢物研究(男性代谢综合征 [METSIM])和西班牙社区健康研究/拉丁裔研究(HCHS/SOL),以及Schlosser等人的尿液代谢组数据。

1. 在NHS、NHSII和HPFS中,共有346种血浆代谢物的数据,来自6610名参与者。

2. CLSA中有1437种血浆代谢物的数据,来自9021名参与者。

3. METSIM中有1391种血浆代谢物的数据,来自6136名参与者。

4. HCHS/SOL中有640种血浆代谢物的数据,来自4926名参与者。

5. Schlosser等人的研究中,有1172种尿液代谢物的数据,来自1627名参与者(见图1)。

在MR研究中,晚期AMD的GWAS数据包括16144例晚期AMD病例和17832例对照(见图1)。

三、研究思路

作者对六项多祖先和多液体数据研究进行了大规模综合遗传和代谢组学分析,以调查代谢物与AMD之间的假定因果关系。包括五个研究目标:

①评估来自28000名参与者的不同血统和生物体液中代谢组数量性状位点(mQTL)的发现和复制;

②利用来自六项多祖先和多液体研究的代谢物,在双向双样本MR框架中全面研究代谢物与AMD风险之间的假定因果关系;

③确定代谢物和AMD之间共有的因果风险变异;

④开发了一个代谢组关联研究(MWAS)框架,通过聚合多个mQTL的遗传效应来识别代谢物与AMD的关联;

⑤将遗传发现与临床表型(包括不同的AMD亚型和脂质生物标志物)联系起来,以解释已识别代谢物的生物学机制(图1)。

图1 研究设计及思路

四、主要结果

① mGWASs

每项研究均进行了代谢组全基因组关联研究(mGWAS)。在NHS、NHSII和HPFS队列中,作者在mGWAS中没有观察到基因组膨胀的证据,基因组膨胀因子(lambda)的范围为0.99至1.03,连锁不平衡(LD)得分回归截距为0.977至1.01。

在NHS/NHSII/HPFS中,共有346种代谢物被分析,基于SNP的遗传力中值为14.7%(四分位距[IQR]:7.2%–21.4%,最高为70%),其中123种代谢物的遗传力具有显著性水平(p<0.05)。在这346种代谢物中,243种(70.2%)显示出至少一个全基因组显著性的mQTL(p<5×10^-8)。从NHS、NHSII和HPFS队列中共鉴定出729个mQTL。

图2展示了来自NHS/NHSII/HPFS、CLSA、METSIM、HCHS/SOL、血浆荟萃分析和尿液荟萃分析的基因组命中,显示了不同祖先和生物体液之间共享的峰值信号。对于血浆数据,作者对26340名参与者的2064种血浆代谢物进行了荟萃分析,鉴定出13065个mQTL(p<5×10^-8)。此外,作者还对Schlosser等人的尿液mGWAS和AMD生物标志物研究进行了荟萃分析,对2072名参与者的1781种尿液代谢物进行了研究,识别出1443个mQTL。

图2 曼哈顿圆形图说明基于代谢物的全基因组关联研究

② mQTL的多祖先和多流体验证

在NHS、NHSII和HPFS血浆中鉴定出的mQTL在CLSA、METSIM和HCHS/SOL研究中得到了很好的验证(见图3)。例如,在HCHS/SOL中提供mGWAS汇总数据的307个SNP-代谢物对(mQTL)中,111个(36%)在HCHS/SOL中达到了全基因组显著性水平(p<5×10^-8)。NHS/NHSII/HPFS发现的组和HCHS/SOL验证队列之间的效应大小一致性非常高(Pearson相关性为0.86,p=6.09×10^-91;见图3A3)。

此外,研究团队还将NHS、NHSII和HPFS血浆mQTL与Schlosser等人的尿液mGWAS数据进行了比较(见图3A4)。在Schlosser等人研究中鉴定出的188个mQTL中,只有13个(6.9%)在全基因组显著性水平上达标(p<5×10^-8)。血浆mQTL和尿液mQTL的Pearson相关性为0.45(p=8.25×10^-11;见图3A4),表明血浆和尿液数据之间共享的mQTL相关性较低。将SNP的效应大小限制在-0.5至0.5之间时,相关性仍然存在,这表明相关性并不仅仅由具有较大效应的SNP驱动。

荟萃分析中的mQTL与每个单独研究中的mQTL高度相关。与上述发现一致,血浆荟萃分析中的mQTL与尿液数据的相关性较低(见图3B)。总体来看,这些结果表明,来自不同人群和测量平台的同一液体中的代谢物效应大小具有高度相关性,而血浆和尿液之间的这种一致性较低。

图3 不同研究中mQTL的多祖先和多流体验证

③ 代谢物与晚期AMD之间的假定因果关系

作者利用已识别的mQTL和晚期AMD GWAS摘要数据进行了双样本MR分析,发现不同研究中的143种重叠血浆代谢物的MR估计值高度一致(见图4A)。在至少一项研究(NHS/NHSII/HPFS、CLSA、METSIM或HCHS/SOL)中,确定了19种与晚期AMD风险相关的代谢物,这些代谢物在不同研究中的效应大小和方向也显示出高度一致性。这个结果表明,不同平台和不同祖先背景下血浆mQTL的一致性提供了可靠的MR估计。

作者的研究通过跨多个大型数据集和不同人群,系统性地揭示了代谢物与AMD之间的潜在因果关系。这不仅增强了我们的理解,也为未来的研究提供了坚实的基础。这种一致性表明,从不同来源和平台获取的数据能够可靠地用于MR分析,进一步验证了结果的稳健性。

图4来自NHS、NHSII、HPFS、CLSA、METSIM和HCHS/SOL的代谢物与AMD之间关联的MR估计值和多流体验证

为提高研究功效,作者随后使用血浆荟萃分析中的mQTL进行了MR分析。经过多次测试调整后,总共鉴定出108种与晚期AMD相关的血浆代谢物(错误发现率 [FDR] 校正p<0.05;见图4B)。这些相关代谢物主要集中在溶血磷脂、甘油磷脂(即甘油磷酸乙醇胺和甘油磷酸胆碱途径)、三自由基甘油、长链多不饱和脂肪酸(PUFA)和缩醛磷脂等途径(见图5)。

反向MR分析也进行了以评估晚期AMD对代谢水平的潜在影响,但仅发现有限的证据支持晚期AMD可能改变代谢水平。在尿液代谢物的荟萃分析中,仅鉴定出五种与晚期AMD相关的代谢物,这可能反映出尿液数据样本量较小或尿液代谢物与晚期AMD之间的真实关联较少。在尿液MR分析中,发现色氨酸代谢途径中的吲哚乳酸与晚期AMD呈负相关。

为了评估MR估计值是否可能违反MR假设,作者进行了各种MR敏感性分析。不同的MR敏感性分析提供了一致的估计值和方向(见图4A)。MR分析显示出足够的功效来检测晚期AMD的中等效应大小,例如,代谢物每增加一个标准差,优势比(OR)为1.2(代谢物遗传仪器的平均方差为3.8%)。具体来说,作者对晚期AMD、脉络膜新生血管(CNV)、地理萎缩(GA)、混合性AMD和中度AMD的分析功效分别为88%、77%、44%、30%和64%。

通过这些分析,作者不仅揭示了代谢物与晚期AMD之间的潜在因果关系,还提供了稳健的证据支持这些关联。这些发现有助于深入理解AMD的病理机制,并为未来的研究和治疗策略提供了新方向。

图5 孟德尔随机化分析的优先代谢途径

④ 代谢物与晚期AMD之间的常见因果变异

通过贝叶斯共定位分析,作者确定了代谢物和晚期AMD的114个潜在因果变异(见图6)。代谢物与晚期AMD之间共定位的遗传变异最常见于APOE、ABCA1、LIPC和CETP基因中或附近。例如,APOE位点的SNP rs429358在晚期AMD和47种代谢物之间共享,其中81%是脂质代谢物。总体而言,作者发现90种(79%)与AMD共享因果变异的代谢物来自脂质途径,支持脂质代谢物在AMD风险中的重要作用(见图6)。这些发现强调了脂质代谢在AMD中的关键作用,并为进一步研究AMD的病理机制提供了新的线索。

图6 共定位分析确定了代谢物和AMD对之间的114个共同因果变异

⑤ MWAS

作者开发了一个代谢组关联研究(MWAS)管道来识别代谢物与AMD的关联。通过MWAS,作者鉴定出155种血浆代谢物,其综合遗传效应在多重测试调整后与晚期AMD风险相关(FDR校正p<0.05)。在MR分析中,这155种代谢物中有96种也与晚期AMD相关,且除一种外,所有代谢物在MWAS与四种MR方法(加权中值、加权模式和逆方差加权MR方法)中的效应方向一致(见图7)。与MWAS的MR分析结果类似,发现与晚期AMD相关的尿液代谢物较少。

图7 全代谢组关联研究与孟德尔随机分析结果的比较

⑥ 代谢物与AMD亚型和脂质生物标志物

作者系统地评估了血浆荟萃分析中MR分析确定的108种血浆代谢物与四种AMD亚型(CNV、GA、中级和混合AMD型)以及六种脂质相关生物标志物(ApoA1、ApoB、CHOL、HDL-C、直接LDL-C和TG)的关系。在AMD亚型分析中,大多数已确定的晚期AMD代谢物也与CNV AMD显著相关,Z得分(关联效应大小除以标准误差)高度一致。对于GA、中级和混合AMD亚型,Z得分与晚期AMD的一致性也很高;然而,重要的代谢物却少得多,这反映出这些AMD亚型的样本量较小。

此外,研究还发现108种代谢物中的大多数与六种脂质相关生物标志物显著相关,这表明这些代谢物可能通过脂质途径参与AMD风险的形成。这些发现进一步支持了脂质代谢在AMD发病机制中的关键作用,强调了代谢物与AMD和脂质生物标志物之间的紧密联系,为未来的研究和治疗策略提供了新的方向和思路。

五、讨论

创新性

这项研究通过大规模综合遗传和代谢组学分析,基于六项多祖先研究中的28000名参与者的数据,确定了与年龄相关性黄斑变性(AMD)相关的新型代谢物。主要发现包括:

1. 通过多项测试确定了108种对晚期AMD具有潜在因果影响的代谢物;

2. 共定位分析揭示了与晚期AMD共享的114个遗传变异;

3. MWAS分析识别出155种与AMD相关的代谢物,其中96种在MR分析中也被鉴定出来。

这项研究的关键创新点在于使用大规模mGWAS跨越不同的血统和生物液体样本,使用多种遗传方法全面评估代谢物与AMD之间的共享遗传成分。这一方法为深入理解代谢物在AMD中的作用及其潜在治疗策略提供了新的视角。

局限性

作者的这项研究也有一定的局限性:

1. MR分析中遗传工具可能存在多效性效应,其中遗传变异可能独立于代谢物暴露而影响AMD;

2. 假设暴露的影响在一生中是稳定的,这意味着代谢物对AMD风险的暂时和短期影响不会被反映出来;

3. 本研究中的代谢物测量来自不同的人群、生物样本和测量平台。因此,并非欧洲人群中的所有血浆代谢物都可以在西班牙裔人群或尿液数据中获得。

本研究发现尿液代谢物与AMD风险之间的关联证据有限,可能由于样本量小和尿液与眼部组织间缺乏联系。血浆代谢物显示脂质相关代谢物与AMD风险有关,但循环代谢物浓度可能不反映眼内代谢途径。需要进一步研究视网膜组织中的代谢物对AMD风险的影响。大多数参与者为欧洲血统,为全面了解遗传变异对代谢物测量和AMD风险的影响,还需包括亚洲和非洲血统个体的研究。

  • 12
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
输入暴露和结局的数据,然后进行孟德尔随机化分析,得出暴露和结局之间的因果关系。下面是使用TwoSampleMR包进行孟德尔随机化分析的步骤: ```R # 安装TwoSampleMR包 install.packages("TwoSampleMR") 多变量孟德尔随机化是# 加载TwoSampleMR包 library(TwoSampleMR) # 输入暴露和结局的数据 exposure_data <- read一种用于实验设计的方法,可以通过随机分配处理组来减少实验中的.table("exposure_data.txt", header=TRUE) outcome_data <- read.table("outcome_data.txt", header=TRUE) # 进行孟混杂因素。下面是一个使用R语言进行多变量孟德尔随机化的代码示例:\n\```R\# 安装并加载“randomizR”包\ins.packges(\randomizR\")\ibrary德尔随机化分析 mr_results <- mr_egger(exposure_data, outcome_data) # 查看结果 summary(mr(randomizR)\n\# 创建一个包含3个处理组和2个因素的数据框\f <- .fram(\ group_results) ``` = (\A\", \B\", \C\"),\ factor1 = (1, 2, 3),\ factor2 = 需要注意的是,输入的数据必须符合一定的格式要求,具体可以参考TwoSampleMR包的文档。此外, (\X\", \Y\", \Z\")\)\n\# 进行多变量孟德尔随机化\randomiz(df, str还有其他一些孟德尔随机化的R包,例如MendelianRandomization和TwoSampleMRGUI等, = \factor1\", block = \factor2\", s = 123)\```可以根据具体需求选择使用。 \n\在这个示例中,我们使用了R语言中的“randomizR”包来进行多变量孟德尔随机化。首先,我们创建了一个包含3个处理组和2个因素的数据框。然后,我们使用“randomiz”函数进行随机化,其中“str”参数指定了分层因素,

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值