参考文章:
Y叔叔公众号
我的第一次ChIP-seq实践
学习一遍ChIPseeker的使用
使用R包ChIPseeker实现对ChIP-seq peaks的注释
1. 输入数据的说明
- 作了ChIP-seq试验,经过初步下机处理并比对参考基因组之后,获得了目标蛋白在基因组区域的结合峰位置。接下来就需要对峰位置进行注释,获得这些峰结合在了哪些基因上,位于基因的上下游还是内部,以便了解目标蛋白的功能。
- 对ChIP-seq峰的结合位置进行注释需要使用上面peak calling产生的结果中的bed文件。
- bed文件中包含5列信息,以tab键分隔。第1列为峰值所处的染色体id,第2-3列为峰值在该染色体中的碱基位置,第4列为峰的id,第5列为信号强度。用Excel打开bed文件就是长这样:
2. ChIPseeker安装
ChIPseeker包可以使用Bioconductor进行安装。
#安装
BiocManager::install("ChIPseeker")
#加载
library(ChIPseeker)
3. 准备基因组注释库
为了对ChIP-seq的峰位置进行注释,查看蛋白主要结合到基因组的哪些区域,首先需要准备对应物种的基因组注释库。
例如,bed文件来源物种是人,就需要准备人类参考基因组注释库。有些R包,例如org.Hs.eg.db中提供了已经构建好的人类参考基因组注释库,可以直接调用。此外,也可以通过GenomicFeatures包,读取基因组注释文件gff3本地构建。
#This script is used for analysis of daizhongye ChIP-seq data
#History
# Lizexing 2020-11-03 First release
#原始测序数据经过在服务器上进行bowtie2比对和macs2 callpeak分析后,得到的bed文件,
#将其下载之本地电脑后进行后续操作
#安装ChIPseeker包
#BiocManager::install("ChIPseeker")
#设置工作目录
setwd("G:/daizhongye/ChIP-seq/2020_10_29/macs2_callpeak/")
#加载ChIPseeker包
library