如果想要查看reads在基因组上的情况,可选用以下两种方法(当然方法很多,在此仅列举以下两种):
1.UCSC
2.IGV(Integrative Genomics Viewer)
以上两种方法均可以以多种格式的文件作为inFile,下面以BAM格式的inFile为例:
(一)UCSC(适用于查看文件不太大的inFile中reads在基因组上的分布情况)
本人所用的服务器上已经安装好了RSeQC的相关组件,且已设置了环境变量。下面直接从运行命令开讲:
1.对file.bam进行sort:
$ samtools sort file.bam file.sorted#得到文件file.sorted.bam;
2.对sort后的文件建立一个索引文件:
$ samtools indexfile.sorted.bam#将得到一个file.sorted.bam.bai索引文件;
3.bam2wig.py对sort后的文件进行处理:
$ bam2wig.py -i file.sorted.bam -s /leofs/noncode/xcl/references/human/hg19/hg19.fa.sizes -o ERR188040.bam.wig#注:这里的-s /leofs/noncode/xcl/references/human/hg19/hg19.fa.sizes是关于参考基因组染色体大小的参数文件,要注意版本问题,下载方法在前面的博文中有讲述。
但是,在运行一段时间后,报错:
/bin/sh: wigToBigWig: command not found
查找原因后,原来是由于环境变量所在目录下,缺少wigToBigWig文件。