1 概要summary
1、我们开发了一个机器学习框架来整合个人基因组和电子健康记录(EHR)数据,并利用这个框架研究腹主动脉瘤(AAA);
2、这个框架定量评估了给定个人基因组基线的情况下,调整个人生活方式的有效性。展示了其作为个人健康管理工具的实用性;
3、我们的研究提出了一种新的疾病基因组分析框架,既可以用于健康管理,也可以用于理解复杂疾病的生物结构。
2 介绍introduction
- 背景:许多复杂疾病很大程度上收到遗传基因的影响,也就是说如果可以知道一个人的基因组对于这些关联疾病的预测和治疗是很有帮助的;但是全基因组获取是很难的,所以需要一种只能从简单的基因组扫描结果中分析信息并将其应用于临床的方法
- 现状:
(1)全基因组关联研究(GWAS)只能得到微弱的信号(weak signals,个人理解为分析出的信息少,且可靠性低)
(2)疾病结果应该是个人基因组和个性化生活方式共同作用的结果,而不应该仅仅依靠于基因组一项进行分析
“这使得综合模型非常可取,该模型能够在普通人群中识别特定疾病的不同基因组倾向,并提供定量和可操作的生活方式调整指南,以将疾病风险降至最低。”
【识别特别疾病的不同基因组倾向】
假设A/B/C/D/E等基因是疾病H的主要关联基因,那么可以将基因A~E称之为基因组Group1
那么由疾病H找到这个关联基因组Group1的过程就是"识别特别疾病的不同基因组倾向"
- 本文方法
AAA有显著的突变异质性,导致GWAS方法无法识别到稳健和可复制的高危基因,为了全面了解疾病背后的突变情况,本文首次对AAA患者和对照进行了高覆盖率的全基因组测序(WGS),并设计了一种新的机器学习框架,将基因组变异直接映射到疾病特征上(图1. A)
这个分析框架,是使用机器学习和网络分析技术构建的,对个体突变效应进行分层建模, 同时鉴定基因和消融生物通路上的聚合突变负荷ÿ