全基因组尺度的增强子--靶基因映射图谱解码非编码突变

Genome-wide enhancer maps link risk variants to disease genes


前言

今天分享的是今年4月发表在nature的一篇文章。这篇文章是麻省理工学院和哈佛大学博德研究所的Eric S.Lander与斯坦福大学遗传学系的Jesse M. Engreitz合作取得最新进展。

1.Overview of approach

该研究创建了开发了一种名为ABC模型(activity-by-contact)的新模型绘制出了131种人类细胞类型和组织中超过600万个增强子-基因图谱,阐明了疾病变体的功能;并揭示了炎症性肠病IBD的新基因和新途径,揭示了577个通过不同细胞类型的作用控制不同性状的基因,并确定了PPIF增强子在调节巨噬细胞线粒体功能中的作用,使用CRISPR扰动在几种细胞类型中进行了验证。
ABC model
文章有两个亮点:

1、涉及72种疾病和复杂特征,利用ABC模型将5,036个GWAS信号与2,249个独特基因相关联,其中包括577个基因类,最终在131种人类细胞类型和组织中创建了增强子-基因图,并用于解释GWAS变体的功能;
2、针对炎症性肠病(IBD),已通过该图谱揭示了基因组调控的原理,即确认了包含IBD风险变体并调节PPIF的表达改变巨噬细胞中线粒体的膜电位的增强子 。

overview of approach

2.Enhancer-gene connections

  预测enhancer和gene的connection十分复杂,connection具有cell type的特异性,并且connection的方向和距离都不相同,还存在一对多的情况,将疾病变体的影响考虑进去,更是增加了预测的难度。
E-G cinnections

3.CRISPRi-FlowFISH

  研究人员提出了一种实验方法CRISPRi-FlowFISH,该方法的关键在于基于目标基因的表达并且通过CRISPRi和荧光原位杂交技术(FISH)来测量候选增强子功能。CRISPRi-FlowFISH结合了CRISPRi(一种基因干扰技术)和FISH(荧光原位杂交技术,一种基因染色技术),通过干扰目标基因附近的候选增强子核苷酸序列,并量化这些序列对目标基因的影响。其主要原理是gRNA可以引导KRAB-dCas9与特定核苷酸序列结合,抑制该序列表达。通过这种方法,可以得到enhancer和gene之间的link(红色的线),并且得到peaks和组蛋白H3K27ac的值,这些值可以得到enhancer的位置。目前已有基于增强子与目标基因的方法、基于基因组三维特征的方法和基于表观基因组特征的机器学习方法用于预测增强子和目标基因之间的功能性连接,其表现均不尽人意。
CRISPRi-FlowFISH
existing model

4.ABC model

  Fulco团队提出了ABC模型,该模型基于简单的生物化学概念:一种远端候选元素对目标基因的定量影响应该取决于它作为增强子的活性(Activity),加权于它与目标基因启动子的3D接触频率(Contact);一个远端候选元素对目标基因表达的相对贡献应该取决于该元素的定量影响除以所有元素的总定量影响。在这个概念下,得到远端候选元素E对目标基因G的相对贡献值公式。计算步骤,

  1. 增强子活性(A)取远端候选元素核苷酸序列上DHS和H3K27ac ChIP–seq 的几何平均值,这两个参数被用于识别增强子。
  2. 接触频率©取5 kb分辨率下,远端候选元素E与目标基因G上启动子之间的由Hi-C实验法测得的KR归一化接触频率。

ABC model

  下面是通过ABC model预测三个gene和7个enhancer调控的举例,activity为DHS和H3K27ac ChIP–seq 的几何平均值,contact frequency通过Hi-C矩阵获得,计算获得ABC 分数。下面的Measured Effect是通过CRISPR测量得到的具体值。第二种gene PVT1中特定的enhancer,接触频率高很多。第三种gene CCDC26,可以看到,enhancer5是唯一对它有调控作用的gene。将以上结果绘图,可以得到他们的E-G调控Map,可以看到他们之间的调控很复杂,一些enhancer skip了PVT1区调控MYC,并且存在多个enhancer调控同一个gene的关系。
ABC model
在K562cell中,不同的距离下都有E-G的link,并且调控对gene的表达量影响也不同。如图是IBD相关基因增强子之间的连接的precision-recall图,分析了其中一个基因的1 Mb范围内的37个非编码可信集,并测试了ABC-Max或其他方法将已知基因优先于基因座所有其他基因的频率。
Precision-recall
Precision-recall

5.The ABC model is generally applicable across cell types

  因为Hi-C data获取非常的昂贵,并且在不同的cell type中变化不大,文章中将不同的cell type的Hi-C矩阵取平均并扩展到更多的cell type中。研究人员利用activity-by-contact(ABC)模型在131个人类生物样品中构建了全基因组的增强子-基因关联图,包括来自ENCODE Project 和其他来源的74种不同的原代细胞、组织和细胞系;在131个生物样品中,研究人员确定了23,219个表达基因和269,539个独特增强子的6,316,021个增强子-基因关联,并通过利用CRISPR扰动比较来验证上述增强子-基因关联预测,其中包括5,755种经过测试的11种细胞类型和状态的元素-基因对。
across cell type
 across cell type

6.Dose ABC connect IBD variants to known cell types and gene?

  IL10是一种抗炎症细胞因子,是一种在免疫调节和炎症中具有多效性的细胞因子。在小鼠中进行的基因敲除研究表明,这种细胞因子在肠道中是必需的免疫调节剂。在这个基因周围,有两个疾病变体,每个都有大概50%的可能性,是基因的risk变体。这两个变体都与一些enhancer重叠,第二种只在后面几种cell type中与enhancer重叠。利用ABC model,可以看到他们之间的link具有细胞特异性,同时ABC model将一个远端的risk变体的link到了IL10基因上。
IL10
  首先为评估增强子-基因关联图谱在将疾病变体与功能联系起来的能力,研究人员对GWAS变体在ABC增强子中的富集进行了量化,并进行精细映射分析。如图1所示,精细映射的GWAS变体在与每个性状相关的细胞类型中显示出ABC增强子中的显着富集,且ABC图谱可以将精细映射的变体准确连接到IBD和其他复杂性状的靶基因,即ABC可以识别与特定表型相关的细胞类型和基因。
IBD
  37个非编码可信集上,一些方法对比发现,最高ABC得分(ABC-Max),表现最好。对于每个特征,在丰富的生物样本中,研究人员针对与ABC增强子相交的精细映射变体(PIP≥10%),将每个可信组分配给具有最高ABC得分(ABC-Max)的目标基因。
ABC-MAX

7.PPIF

  为了探索ABC图谱如何加速实验研究,以确定单个GWAS基因位点的特征,研究人员检测了染色体10q22.3的炎症性IBD风险位点,ABC图谱确认了一个优先级基因。如图所示,高概率变异体(rs1250566,PIP = 19%)位于ZMIZ1的内含子中,在几种免疫细胞类型中与ABC增强子重叠,发现了调节PPIF表达的14种增强子,其中只有一个包含精细映射的IBD变体,并且该增强子对PPIF表达具有显著作用,而PPIF编码亲环素D,可通过控制线粒体通透性和线粒体膜电位,调节代谢、活性氧信号传导和细胞死亡。随后研究人员利用CRISPR干扰实验确认该增强子通过PPIF可以调节细胞中响应炎症刺激的线粒体的代谢状态;除此之外,PPIF具有极其复杂的增强子态势,除IBD之外还包含针对39种其他疾病和性状的GWAS信号,意味着PPIF的细胞类型特异性转录调控可能影响多种复杂疾病和性状。

PPIF
PPIF
  下图是通过CRISPRi实验得到的一些结果。在静止和刺激条件下,CRISPR -i在e-PPIF上对免疫细胞系中PPIF表达的影响。数据是平均值±平均值的95%置信区间。使用Benjamini-Hochberg校正法(* P <0.05)进行了双向学生t检验,比较了814个阴性对照gRNA对164个靶向e-PPIF的CRISPRi gRNA。从左到右调整的P值:4.68×10 -101,4.86 ×10 -112,0.019,0.044和1.48×10 -71。d,CRISPRi gRNAs的影响(针对电子PPIF,PPIF上Δ启动子或阴性对照)ψ米,量化为THP1细胞携带具有高的MitoTracker红信号(扩展数据图进行比较的是具有低的那些gRNAs的频率。10F –h)。显示了log 2转化的细胞部分(未经刺激的对照处理)。我们在未刺激的条件下测试了THP1细胞,用LPS刺激,并用佛波12-肉豆蔻酸酯13-乙酸酯(PMA)分化,并用LPS刺激(方法)。数据分别为对照,PPIF和e-PPIF的40、9和5个gRNA平均值的平均值±95%置信区间。双面Wilcoxon秩和检验;* P = 0.0163,P = 0.00426,* P = 0.000356,相对于对照。
CRISPER
  对于IBD和12个血细胞性状,它们在我们的数据集中具有更好的相关细胞类型覆盖率,ABC增强子包含732个PIP≥95%的非编码变体中的46%。如今研究人员利用来自其中一名参与者的数据产生了100多张增强子-基因图谱。
136 celltype
future

  文章将所有的增强子-基因图谱做了可视化,上面可以选择rick变体和gene,下面是相关的ABC分数,可用做筛选,右边是相关的DNA可及性数据。以上所有的network,dataset和locus都已可视化并且可以在网址https://www.engreitzlab.org/resources下载。

ABC enhancer-gene connection

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值