解决方法:
将bowtie得到的bam文件,转换为bed文件,并使用cat指令,将其所有重复实验文件合并,将合并文件作为输入文件,进行peaks calling。
参考链接:MACS官网
http://liulab.dfci.harvard.edu/MACS/00README.html
Notes:
3) For the experiment with several replicates, it is recommended to concatenate several ChIP-seq treatment files into a single file. To do this, under Unix/Mac or Cygwin (for windows OS), type:
$ cat replicate1.bed replicate2.bed replicate3.bed > all_replicates.bed
附录:
我的数据
样本 | 数据 |
重复样本1 | SRR6168965 |
重复样本2 | SRR6168971 |
重复样本3 | SRR6168972 |
过程代码
(base) s45@HP45:~/chip-seq_analysis/1-bowtie/2-lung$ bamToBed -i SRR6168965.bam >SRR6168965.bed
(base) s45@HP45:~/chip-seq_analysis/1-bowtie/2-lung$ bamToBed -i SRR6168971.bam >SRR6168971.bed
(base) s45@HP45:~/chip-seq_analysis/1-bowtie/2-lung$ bamToBed -i SRR6168972.bam >SRR6168972.bed
(base) s45@HP45:~/chip-seq_analysis/1-bowtie/2-lung$ cat SRR6168965.bed SRR6168971.bed SRR6168972.bed >lung_all.bed
lung_all.bed是最终三个样本数据合并的文件。
MACS分析指令:
(base) s45@HP45:~/chip-seq_analysis/2-macs2_change$ macs2 callpeak -t /home/s45/chip-seq_analysis/1-bowtie/2-lung/lung_all.bed -f BED -g mm -n lung_all -B -p 0.0001 --outdir /home/s45/chip-seq_analysis/2-macs2_change/
但是,后来实践发现,以上方法分析得到的peaks序列与原文献数量相比,大大增加,原因不明。
觉得不对。
后来发现一篇博文,解决了我的疑惑,请有相同疑惑的同学可以参考:
参考链接(https://www.jianshu.com/p/d8a7056b4294)使用bedtools取共有的overlap区,猜得到与文献相似的结果。猜想这是合适的对于重复样本取overlap的方式。