引言:
在医学研究中,探索疾病与风险因素之间的因果关系是一项重要但复杂的任务。传统的观察性研究虽然能够揭示关联,但往往难以确定因果方向。孟德尔随机化(Mendelian Randomization, MR)分析作为一种新兴的统计方法,利用遗传变异作为自然实验的工具,为我们提供了一种评估因果关系的新途径。然而,MR分析的复杂性常常让没有编程背景的医学生望而却步。为了解决这一问题,我开发了一个用户友好的网页工具,旨在简化MR分析的复杂性,使其更加易于理解和操作。
背景
在现代医学研究中,确定疾病与风险因素之间的因果关系是一项至关重要的任务。孟德尔随机化分析作为一种新兴的方法,通过利用遗传变异作为自然实验的工具,为我们提供了一种评估因果关系的有力手段。尽管MR分析在理论上具有显著优势,但其在实际操作中需要复杂的统计方法和编程技能,这使得许多医学研究者难以涉足。
简化MR分析:我的网页工具
为了使MR分析更加普及,我开发了一个用户友好的网页工具。这个工具通过以下几个关键特点,使得MR分析变得更加容易:
• 无需编程知识: 用户无需编写代码即可进行复杂的MR分析。
• 直观的网页界面: 简洁明了的界面设计,让用户轻松输入数据和调整参数。
• 一键分析: 提供一键执行分析的功能,简化了操作流程。
• 结果可视化: 分析结果通过图表和图形直观展示,便于用户理解和解释。
整体操作流程
- 运行脚本: 启动本地服务器,准备后台环境。
- 访问网页: 打开本地网页 http://127.0.0.1:5000,直接访问主界面。
- 选择分析步骤: 根据需要,选择提取暴露因素等分析步骤。
- 调试参数: 根据GWAS ID等信息调试设置参数,点击分析按钮。
- 查看数据集: 分析完成后,数据集随时可查,支持离线数据Excel储存。
- 查看结果: 图表和图形结果支持离线存储查看,方便随时回顾。
网页主界面
举例演示
在本部分,我将通过一系列截图,逐步展示如何使用我的网页工具进行单基因的孟德尔随机化分析。这将包括从数据提取到最终的MR分析的每个步骤。
举例探究奶酪摄入(Cheese intake)和冠心病(Coronary heart disease)之间的关系.
- 选择感兴趣的基因:
从 IEU(https://gwas.mrcieu.ac.uk/)GWAS 数据库提取与感兴趣的结局相关的工具变量
例如,我们可以假设用户选择了与Cheese intake相关的基因, 对应的GWAS ID: ukb-b-1489。
选择的结局变量是Coronary heart disease, 对应的GWAS ID: ieu-a-7。 - 提取暴露因素:
接下来,用户将通过网页工具的界面操作:
- 找到暴露因素所在的选项, 点击 Analysis, 之后会出来参数框;
- 设置需要设置的参数(这里我主要就是输入Outcome ID: ukb-b-1489, 其他都是默认值), 然后点击submit按钮;
- 操作完成等待分析数据完成后会自动跳转到数据集界面,用户可以查看提取的数据集;
- 需要进行下一步就点击back;
- 如果需要再次查看数据集可以之间点击 Show;
- 获取结局变量:
接下来,用户将通过网页工具的界面操作:
- 找到结局变量所在的选项, 点击 Analysis, 之后会出来参数框;
- 设置需要设置的参数(这里我主要就是输入Outcome ID: ieu-a-7, 由于不需要代码, 就设置 proxies 为 False, 数据需要设置了 maf 为 0.01, 其他都是默认值), 然后点击submit按钮;
- 操作完成等待分析数据完成后会自动跳转到数据集界面,用户可以查看提取的数据集;
- 需要进行下一步就点击back;
- 如果需要再次查看数据集可以之间点击 Show;
-
统一效应等位与效应量:
操作基本一致, 也是点击 Analysis, 选择参数, 点击 Submit, 查找使用 Show, 区别只是参数的选择上的差异.
-
进行MR分析:
操作基本一致, 也是点击 Analysis, 选择参数, 点击 Submit, 查找使用 Show, 区别只是参数的选择上的差异, 这里我选择了mr_ivw_mre.
-
生成OR置信区间
操作基本一致, 也是点击 Analysis, 由于没有选择需要参数, 所以之后是直接点击 Submit, 查找使用 Show.
-
异质性检验
操作基本一致, 也是点击 Analysis, 由于没有选择需要参数, 所以之后是直接点击 Submit, 查找使用 Show.
-
水平多效性检验
操作基本一致, 也是点击 Analysis, 由于没有选择需要参数, 所以之后是直接点击 Submit, 查找使用 Show.
-
留一图
操作基本一致, 也是点击 Analysis, 由于没有选择需要参数, 所以之后是直接点击 Submit, 查找使用 Show, 这里直接返回的界面是把数据集和图都显示出来了.
-
单个SNP分析
操作基本一致, 也是点击 Analysis, 由于没有选择需要参数, 所以之后是直接点击 Submit, 查找使用 Show.
-
散点图
操作基本一致, 也是点击 Analysis, 由于没有选择需要参数, 所以之后是直接点击 Submit, 查找使用 Show.
-
森林图
操作基本一致, 也是点击 Analysis, 由于没有选择需要参数, 所以之后是直接点击 Submit, 查找使用 Show.
-
漏斗图
操作基本一致, 也是点击 Analysis, 由于没有选择需要参数, 所以之后是直接点击 Submit, 查找使用 Show.
-
以上的每一步操作, 数据都可以回溯重新生成, 但是往后的步骤如果依赖于前面的步骤生成的数据, 那也需要再次生成刷新数据.并且都存在本地文件夹下面的data.xlsx, 为每份数据都创建了一个sheet用来记录, 可供随时查看.
-
以上生成的图片也已经存储在本地文件夹下, 可以随时查看导出.
网页工具的不足与未来展望
虽然这个网页工具极大地简化了孟德尔随机化分析的过程,使其更加易于访问,但它目前还存在一些局限性:
- 单基因分析限制
目前,工具仅支持单基因分析。对于需要联合多个基因进行更复杂分析的研究,用户可能需要寻找其他工具或方法。 - 本地服务器依赖
工具依赖于本地服务器运行,这意味着用户需要设置必要的环境(例如R语言环境),这可能对那些希望避免任何代码设置的用户来说是一个挑战。
针对这些局限性,我正致力于不断改进这个网页工具,以满足更广泛的用户需求。以下是我计划在未来版本中实现的一些关键改进:
- 扩展多基因分析支持
尽管实现这一功能面临诸多挑战,我正努力开发多基因分析功能,以便用户能够探索基因间的相互作用及其对疾病影响的复杂性。 - 简化环境设置
我认识到代码设置可能成为用户的障碍,因此我的目标是进一步简化这一过程,尽可能减少用户在环境配置上的工作量。 - 搭建远端服务器
为了提供更加无缝的用户体验,我计划搭建远端服务器。这样,用户就可以在无需关心运行环境的情况下使用工具,尽管这可能会增加我们的运行和维护成本。通过这些改进,我希望这个网页工具能够更好地服务于广大用户,无论他们的技术背景如何。
关于专业性的说明
需要指出的是,我并非医学专业人士。在孟德尔随机化分析的步骤和方法上,我可能无法达到专业研究者的水平。我的主要目标是简化操作流程,让这一强大的分析工具更加易于访问和使用。
关注我
如果您对孟德尔随机化分析或我们的网页工具感兴趣,欢迎关注我的公众号。在那里,您可以获取更多关于代码和操作的细节,并与我和其他用户一起交流心得。