通过前面两篇文章对MutMap原理和分析流程的介绍,我们对MutMap的分析已经有了比较深入的了解,是时候来点儿数据实战一下了!
MutMap的发明者已经搭建好了一套Pepline,并写好了MutMap pipeline framework供大家免费使用。我们只需要将数据按照要求进行放置和命名,并通过非常简单的几个命令,将任务提交给服务器,经过三五天的分析(以水稻为例),就可以拿到结果了。
1.分析环境的搭建
首先,我们需要有一台Linux服务器。由于分析过程中需要进行大量的运算,个人PC的配置根本吃不消。所以我们需要一台服务器,当然配置越高越好。在服务器上安装Linux系统,我们使用的是Redhat,当然也可以选择免费的Ubuntu或CentOS。
然后,在服务器安装如下软件:Perl (v5.8.8) 5.22.2
R (version 2.15.0) 3.0.1
BWA (version 0.5.9-r16) 本版
SAMtools (0.1.8 or before) 本版
(括号中的为推荐版本,后面的黑体为我自己使用的版本)
关于FASTX-Toolkit版本的选择:
一定要安装0.0.13及以上的版本,因为从0.0.13开始FASTX-Toolkit才开始支持Illumina 1.8+ Phred+33的质量打分规则,否则会报错。就这一个报错,花费了我一天的时间,直到使用conda安装了0.0.14版本才解决。(2018.01.24记)。
2.MutMap pipeline framework的下载和安装
先下载MutMap pepline程序,解压到Linux系