文章目录
一、处理数据
处理Chip-seq数据,得到fasta数据
1、取Chip-seq片段长度400
由于大多数(40783)分布于0-400bp,于是取起始位点终止位点的中心,左右个200的区间。
1.批处理批量修改文件后缀名(假设我需要把一个文件夹中的很多txt文件改为sql文件):
1)在需要被处理的文件的文件夹里先新建一个txt文本,然后在文本中写入:
ren *.txt *.sql
2)保存文件后关闭,然后将这个文件的后缀名改为.bat
3)双击这个bat文件,ok,这个文件夹中所有的txt文件都变成sql文件了~~
2、得到输入文件(.fa)
取完左右得到bed格式文件(CTmax-B20.200.bed),与fasta匹配(ucsc.hg19.fasta)
bedtools getfasta -fi /Users/sun/Downloads/匹配/参考基因组/ucsc.hg19.fasta -bed CTmax-B20.200.bed -fo /Use