marker区域基因注释规则解析

概述:

对靶区进行基因功能注释,一般而言会研究其邻近TSS基因,认为靶区更易受该基因调控;对于靶区覆盖多个基因或功能区的情况,会做注释取舍;对这些基本的注释规则进行理解如下

一、distanceToTSS计算规则

常用软件如ChIpseeker,其基本注释为:根据注释文件每个基因位于的链特征及marker上下游特征,自定义计算distanceToTSS,寻找邻近基因,distanceToTSS计算规则如下:

1)若注释基因位于上游正链,distanceToTSS = genestart - marker start
2)若注释基因位于上游负链,distanceToTSS = geneEnd - marker start
3)若注释基因位于下游正链,distanceToTSS = genestart - marker end
4)若注释基因位于下游负链,distanceToTSS = geneEnd - marker end

根据绝对距离,确定TSS最邻近基因。

二、注释文件选取

邻近TSS基因完全依赖于注释文件,不同版本注释文件相对重要,较老版本多注释到距离更远的基因上,新版本虽能找到更近的基因,但基因功能明确度可能存疑,因此需要选取合适的基因注释文件,诸如如gencode(https://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_45/)、UCSC等

三、具体应用

以ChIpseeker为例(Homer应用类似),加载相关包:

library(“ChIPseeker”)
library(clusterProfiler)
library(“org.Hs.eg.db”)
library(GenomicFeatures)
library(TxDb.Hsapiens.UCSC.hg38.knownGene)
txdb <- TxDb.Hsapiens.UCSC.hg38.knownGene

对于注释文件配置,默认可以加载USSC相关包,若自定义注释文件,则需要进行特别加载:

txdb<-makeTxDbFromGFF(“D:/test//target/gencode.v19.chr_patch_hapl_scaff.annotation.gtf”)

配置完主要文件后,加载靶区region进行annotation:

peak =readPeakFile(“target.peak”)

peakAnno <- annotatePeak(peak, tssRegion = c(-3000, 3000), TxDb =txdb,annoDb=“org.Hs.eg.db”) ## promoter默认为TSS上下游3Kb,因此实际出来的结果没有upstream,annoDb可以补充SYMBOL\GENENAME等相关信息

得到主要结果后,可进行注释可视化:
在这里插入图片描述
对于同一个区域包含不同的基因功能区注释,会根据优先级进行展示 : Promoter>5’ UTR>3’ UTR>Exon>Intron>Downstream>Intergenic即一个区域同时存在Promoter和Exon时,该区域会被注释为Promoter
若要展示靶区中全部区域,可使用以下命令进行相关展示:

overlap <- peakAnno@detailGenomicAnnotation ##具体结果
upsetplot(peakAnno,vennpie=TRUE) ##交集可视化
在这里插入图片描述

对于1个区域包含不同基因调控区,由于存在优先级注释特点,部分覆盖区域优先级靠后或同一个优先级的基因无法进行注释;对该类情况初步可使用注释文件不同区域直接进行overlap处理,但对于基因间区暂未想到较好的办法
其余命令如转录结合强度等可细参考ChIpseeker包相关命令。

随后可拉出具体的geneID使用clusterprofile进行功能注释:

a<-data.frame(peakAnno)

ekk <- enrichKEGG(gene =a$geneId, organism = “hsa”, keyType = “kegg”, pAdjustMethod = “BH”, pvalueCutoff =0.05,qvalueCutoff = 0.05)

ego <- enrichGO(gene = a$geneId,keytype = “ENTREZID”,OrgDb = org.Hs.eg.db,ont = “ALL”,pAdjustMethod = “BH”,qvalueCutoff = 0.05,readable = TRUE)

  • 25
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值