第一篇博客,初来乍到,欢迎交流哈。未经本人授权禁止转载。
记录一下mummer做dotplot的过程:
1.下载mummer,官网在http://mummer.sourceforge.net/ 再配环境变量,也可以直接apt-get install mummer。
如果要画图还要安装gnuplot, libx11-dev包。
2.将需要比对的两个fasta文件(A.fasta, B.fasta)放到新建的目录下,然后用nucmer -maxmatch -c 100 A.fasta B.fasta -p result
将得到all-all的比对文件result.delta。
之所以用nucmer是因为我的两个序列同源性较高,而且每个fasta是个multisequences的文件,包括多个scaffolds。
这个地方一定需要注意的是:原始fasta的header格式要对,而且一定换行符要对。因为windows下是\n\r的,所以在win下生成的文件到linux下会不识别。所以win的序列需要用ue做dos到unix的转换。否则会报no alignment data to plot 的错误。
3.下面可以做多种分析,我这次只画dotplot,所以mummerplot -large -fat(or -l) -nocolor -postscript -p dotplot result.delta
因为scaffolds有点多,图里面的grids太密了。但貌似没有选项可以删(也许在gnuplot里,不过没研究过,时间紧张算了),所以拷回来用win改吧。
4.输出为dotplot.ps文件。
可以在win下用corelDraw或者Ai修改(我的corelDraw显示有问题,所以先用Ai改的)。
2015.12.16备注:nucmer 的 -l -c 参数对于比较短的匹配可以有一个过滤,如果杂点太多可以将它调大