peak注释信息揭秘

欢迎关注”生信修炼手册”!

在chip_seq数据分析中,peak calling是核心,得到peak区间之后,我们首先需要对peak进行注释。所谓的注释其实是一个比较宽泛的概念,其中包含了以下多种类型的注释信息

1. enrichment profile

profile是一个生信分析中的高频词汇,在不同组学数据中有不同的含义,在这里代表的是peak区域的reads在基因组上的分布。最基础的注释内容就是查看peak区域的reads在各个染色体上的分布,示意如下

enrichment代表的是富集,这里的富集是针对某个特征位点而言的,比如最常见的在转录起始位点两侧peak reads的分布图,示意如下

折线图反映的是所有转录本上peak区域reads的分布情况,为了将所有转录本用一个值来表示,通常会取均值。对应的还有一种热图的展示方式,每一行代表一个转录本,示意如下

除了TSS这种单个位点的分布外,还可以展示整个基因组上的分布,示意如下

2. genome location annotation

这种注释主要分析peak区间与基因组各种区间的overlap情况,比如5’UTR,3’UTR, exon等区域,然后绘制饼图或者柱状图,示意如下

根据注释文件的不同,划分的基因组区域也有所变化。

3. gene annotation

这部分注释主要分析peak区间与基因的关系,可以细分为overlap gene和nearest non-ovlap gene两种。第一种分析确定peak区间位于哪些基因的区域,示意如下

第二种分析peak上下游最近的区间没有交集的基因,示意如下

之所以做基因注释,是为了探究转录因子或者组蛋白修饰的靶基因,目前对于靶基因的筛选策略并没有统一的说法,以上两种注释筛选出来的基因都可以作为候选的靶基因,然后进行后续的GO/KEGG等功能富集分析。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值