欢迎关注”生信修炼手册”!
通常在分析peak区域对应的靶基因时,会选取转录起始位点TSS上下游一定长度的区域作为候选的靶基因范围,本文介绍下如何利用bedtools来对peak与TSS区域的overlap情况进行分析,从而得到靶基因,可以分为以下几步
1. 得到物种对应的TSS位点信息
以hg38
为例,通过UCSC的FTP服务可以得到物种对应的refFlat
文件,链接如下
http://hgdownload.soe.ucsc.edu/goldenPath/hg38/database/
refFLat
和refGene
这两个文件记录的信息相同,refFlat
文件列数更少,这里我们选择下载refFlat.txt.gz
, 该文件的内容如下所示