ChIP-seq/DAP-seq/ATAC-seq/CUT&Tag结果可视化-IGV使用攻略

  背景介绍  

你是不是经常在文献中看到下面这种图,好奇如何做的?在发表ChIP-seq/DAP-seq/ATAC-seq/CUT&Tag文章时,想在文章中放几张目标基因的可视化图?

图片

项目文章 | Plant Physiology 华南农业大学揭示组蛋白修饰调节水稻器官大小的表观遗传机制

图片

喜讯!ChIP-seq再立功,组蛋白去甲基化酶在水稻种子的表观调控机制见刊The Plant Journal

要做此图之前,我们首先得搞清楚两个问题

1、这个图是干嘛用的?

2、怎么看?

答案是:此图是测序reads的可视化,利用reads和参考基因组比对之后的结果,用来展示目标基因上的转录因子结合/组蛋白修饰/染色质开放性的。

鉴定转录因子在基因组上结合常用的技术手段是ChIP-seq/DAP-seq,检测组蛋白修饰的全基因组分布用ChIP-seq/CUT&Tag,而对染色质可及性的检测则用ATAC-seqChIP-seq/DAP-seq/CUT&Tag的原理都可以归纳为目标蛋白在基因组某个位点结合后,含有该位点的DNA片段将会被选择性富集;测序之后,来自于此DNA片段的reads较其他非蛋白结合的DNA片段reads多,在数据可视化上呈现一个堆集起来的山峰(在计算机概念上叫“peak”)。ATAC-seq的原理则是利用Tn5转座酶特异性识别染色质开放区并酶切该区域,这样在测序之后,来自于染色质开放区的reads也会较非染色质开放区的reads多,形成peak。

IGV基础知识  

在掌握上面这些基础知识之后,就用来到今天的重点,怎么画这幅图?如果你有生信基础和环境,推荐你用R包Gviz。如果你没有生信基础,那就给你推荐今天的主角IGV

IGV(Integrative Genomics Viewer),一款便捷的交互式使用工具,用于基因组数据的可视化,支持Windows/MacOS/Linux多平台使用,同时支持FASTA/GFF/GTF/BAM/BED/TDF/bedGraph/BEDPE/bigBED/bigGenePred/bigNarrowPeak/bigWig……多种格式文件输入。一般,我们常用到的文件格式主要是FASTA/GFF/GTF/BAM/BED/TDF/bigWig。

◆  FASTA:或称.fasta或.fa文件,指定导入参考基因组的参考序列。FASTA文件中的序列名称是出现在IGV工具栏的染色体下拉列表中的染色体名称。IGV根据染色体的名称对它们进行排序,而不是它们在FASTA文件中的顺序。

◆  GFF/GTF:通用特征格式(GFF)文件是一个简单的制表符分隔的文本文件,用于描述基因组特征(基因结构:基因起始和终止位置,外显子、内含子所在位置以及基因的转录方向)。IGV支持GFF2、GFF3和GTF文件格式,GFF3是最常用的。

◆  BAM:BAM(.bam)文件是SAM文件的二进制版本,SAM文件(.sam)是一个包含序列比对数据的制表符分隔的文本文件,IGV也支持BAM格式。值得注意的有两点,一是BAM和SAM都得按位置排序并索引,排序和索引可以用igvtools完成;二是参考基因组和SAM/BAM的染色体名称必须一致(很多人很容易忽视这点,导致文件导入后没有图像,只是一条线)。

图片

图片

◆  BED:BED(.bed)是一个用于定义特征(可以是基因、SNP位点、甲基化位点、peak)轨迹以制表符分隔的文本文件,它可以有任意文件扩展名,但建议是.bed。

◆  TDF:TDF(.tdf)是一个二进制文件,用窗口的方式来记录测序深度信息。相比BAM文件,TDF文件会小很多,导入和查看也更快速。可以通过igvtools来生成TDF文件。下图清晰表明了两者的区别,在较小的分辨率下,bamcoverage基本和tdf无异;但当分辨率较大的时候,可以看出bam是以单碱基存储深度的,而tdf是以区域内储存平均深度的。

图片

图片

◆  bigWig:和TDF类似,只是统计区间相较于TDF更大。类似的文件还有bedGraph,统计区域比TDF还小。下图展示了三种文件的区别,在小分辨率下几乎没差异,在大分辨率下就会看出细节差异。因此,在文件大小上,bedGraph > TDF > bigwig。一般以bigWig(.bw)上传到数据库。

图片

图片

图片

图片

  IGV的使用  

第一步:IGV安装

上IGV官网,下载对应电脑系统的程序,按照提示安装即可。下载链接:https://igv.org/doc/desktop/#DownloadPage/

第二步:IGV使用

首先,导入基因组。从IGV导航栏里的Genomes >> Load Genome from File进入;

图片

接着,导入注释文件。从导航栏里的File >> Load from File进入;

图片

当然,你也可以选择创建一个genome文件,将序列文件和注释文件合一,下次就不用再分别导入两个文件了。创建方法为:从导航栏里的Genomes >> Create. Genome File进入,然后在对话框里依次输入待创建基因组的命名,导入序列文件和注释文件,最后点击确认,设置好存储位置即可。

图片

图片

接下来是重点,导入待看的track文件(TDF/bigwig/bedgraph)单击鼠标左键选择track(ctrl+单机左键可同时选择多个track),然后单击鼠标右键调出设置栏,调整track高度和data的范围,使峰型图在视野里看起来更合适。Tips:每个基因上的强度存在差异,因此data的range要根据目标基因设定,可以多次设定。图形没完全显示,就把值调大点;图形太矮,就把值调小一点。总之一点,怎么好看怎么来,调到自己满意即可

图片

图片

图片

图片

随后,定位到目标基因。下面以本文第一幅图的OsCKX1(Os01g0187600:chr01:4,695,238-4,701,036)为例展示。主要有两种方法:1)大概定位法:根据基因的大概位置,下拉染色体框,选择对应的染色体,然后缩小区间。比如OsCKX1在chr1上的大概4.7M的位置,先用定位框选择5Mb左右的一个大框,然后再在4.7Mb再次精细框选。2)直接输入法:在输入框里面输入基因(注意基因名和基因ID的区分)或者基因的精确染色体定位,点击Go就可以直接跳转到目标基因了。

图片

图片

图片

图片

图片

以上两种方法都可以定位到目标基因,随后就是图像美化,我们按照发表文章里的色泽。将WT的track改成粉色,Ossdg711的track改成绿色。和调整track的高度和数据值一样,先调出设置栏,点击Change track Color,选择想要的颜色。Tips:不同track设置不同颜色时,要一个一个track调整

图片

图片

调整好了图像之后,从File >> Save Image保存图像,以矢量图.svg格式存储,方便后面用AI编辑。

图片

  后  记  

如果您觉得自己一个一个基因编辑美化太麻烦,爱基百客生物可以提供ChIP-seq/DAP-seq/ATAC-seq/CUT&Tag等全套技术服务,提供可视化文件供您检索基因。此外,我们的生信团队还能提供您挑选后的指定基因的可视化绘图服务。欢迎与我们联系。

图片

  • 23
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: ChIP-seq(Chromatin Immunoprecipitation sequencing)是一种用于研究基因组上转录因子和其他蛋白质与DNA相互作用的方法。它通过先对特定蛋白质与DNA的结合位点进行免疫沉淀,再对沉淀下来的DNA片段进行测序来确定该蛋白质结合的基因位点。 CUT(Chromatin Uptake Test)是一种用于评估基因组上DNA片段与转录因子结合位点的灵敏度和特异性的方法。它通过将转录因子和指定的DNA片段混合,再检测该片段与转录因子的结合情况,来评估该片段是否是有效的转录因子结合位点。 ### 回答2: &RUN和CUT&RUN。 ChIP-seq (染色质免疫共沉淀测序)是一种广泛应用于研究DNA与蛋白质相互作用的技术。它通过特定抗体选择性地富集感兴趣的染色质区域,然后将富集的DNA进行测序,从而揭示DNA上与特定蛋白质的结合位点。这种技术常用于研究转录因子结合位点、组蛋白修饰和表观遗传学等领域。ChIP-seq技术的发展使得我们能够全面了解基因组中与蛋白质结合相关的生物学事件。 CUT&RUN (在位关联与次世代测序)是一种近年来涌现的新技术,用于研究蛋白质-DNA相互作用。CUT&RUN利用转录因子结合的DNA线索,将固定在细胞核中蛋白质DNA复合物释放,并以线粒体在胞浆液相中的镍作为固定荧光探针依赖式的。”CLEUR-inatableCLEUR发发挥增长实际形态用聚合物精确分子一次性直到整个复习常常经历。这种华丽奇妙的结果将DNA定点修复到某些酶反应的消息。 ChIP-seqCUT&RUN都是现代生命科学中常用的技术,用于揭示蛋白质-DNA相互作用引发的生物学进程。虽然它们基本原理不同,但这两种技术的应用领域有许多重叠之处。使用这些技术,科学家可以研究基因组中特定区域的结构和功能,从而深入理解遗传和表观遗传学机制。 ### 回答3: &Tag=biotech.chapter.peak.finding and differential binding analysis ChIP-seq(染色质免疫沉淀测序)和CUT(染色质核苷酸可及性测序)是两种在研究染色质调控方面广泛使用测序技术。 ChIP-seq是通过免疫沉淀染色质中特定蛋白质结合的DNA片段,并使用高通量测序技术对其进行测序。这种技术可以用来研究蛋白质与特定基因座的相互作用,从而帮助我们了解基因调控的分子机制。通过ChIP-seq,我们可以鉴定蛋白质结合位点的位置,进而确定哪些区域与基因表达相关。此外,ChIP-seq还可以用于研究转录因子的结合位点、组蛋白修饰和染色质重塑等过程。 CUT是一种用于研究染色质核苷酸可及性的测序技术。通过CUT技术,可以高通量测定染色质中DNA的特定区域是否处于开放的染色质结构。开放的染色质结构通常与基因的转录活性相关。CUT可以通过抑制DNA甲基化酶或降低染色质的凝结程度来确定染色质核苷酸的可及性。CUT技术还可以用于研究染色质可及性与某些疾病和发育过程之间的关联。 总而言之,ChIP-seqCUT是两种重要的染色质测序技术,可以帮助我们揭示染色质调控的分子机制。ChIP-seq可以鉴定蛋白质结合位点,而CUT可以测定染色质核苷酸的可及性。这些技术的应用有助于我们进一步了解基因调控、转录因子结合、染色质修饰和疾病发生等过程。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值