mummer基因组共线性分析详解

在生物信息中,基因组共线性分析dotplot图几乎全部是用MUMmer或者LAST做的。相比对LAST,MUMmer生成的图似乎更加美观和详细,last-plot会可能会省略一些过长的id,而mummerplot会全部写出来。

1. MUMmer的安装

1.1 安装MUMmer主程序前,需要先安装gnuplot:

从gnuplot的官网http://www.gnuplot.info/ 链接到其sourceforge: http://mummer.sourceforge.net/下载页。

注意:最新版的gnuplot v5.2.6在后续运行时与MUMmer4可能不太兼容,会报如下错误:

"sample.gp" line 45: warning: this copy of gnuplot has no mouse support
set mouse format "%.0f"          ^
"sample.gp" line 45: unexpected or unrecognized token
WARNING: Unable to run '/path/to/gnuplot-5.2.6/bin/gnuplot sample.gp', Inappropriate ioctl for device

这里下载的稳定的老版本gnuplot v4.6.2,读者也可以尝试其它更高一些的老版本,欢迎将测试结果分享到讨论区。

mkdir gnuplot && cd gnuplot

wget https://sourceforge.net/projects/gnuplot/files/gnuplot/4.6.2/gnuplot-4.6.2.tar.gz

tar -zxvf gnuplot-4.6.2.tar.gz

./configure --prefix=$PWD

make

make install

注意:如果有报错,可以尝试升级gcc版本
完成后,需要将生成的bin目录加到环境变量中

export PATH=/path/to/gnuplot/gnuplot-4.6.2/bin:$PATH
1.2 再来安装mummer:
mkdir MUMmer4.00b2 && cd MUMmer4.00b2
#MUMmer4.00b2是其安装目录
从MUMmer GitHub下载最新版mummer-4.6.2beta2,并安装:
wget https://github.com/mummer4/mummer/releases/download/v4.6.2beta2/mummer-4.6.2beta2.tar.gz
tar -zxvf mummer-4.0.0beta2.tar.gz
cd mummer-4.6.2beta2
./configure --prefix=$PWD
make
make install

mummer套件中其它程序还好,如果最难搞的mummerplot安装完成,就明表明安装OK。可以通过以下结果来验证是否安装完整。

2. MUMmer的运行

建议将MUMmer的路径写到运行时的shell脚本中,当然也可以一次性写到$HOME/.bashrc中

export PATH=/path/to/MUMmer4.00b2/mummer-4.0.0beta2/bin:$PATH

step1: run nucmer for alignment

nucmer --threads 32 --mum -D 5 -p <outpfix> <subject> <query>

outpfix是输出文件前缀

subject和query是想要比较的两个序列文件,fasta格式

step2: filter alignment result

delta-filter -i 85 -l 8000 -o 85 <outpfix>.delta -1 > <outpfix>.best_delta

其中-i指定最小的alignment相似性阈值
-l,注意,这里是字母小写的L,指定最小的alignment长度
-o 和-r,-q相关,可以理解为alignment coverage
-1注意,这里是数字1,指定是否进行一对一的比对,一个位置(subject或query上)只找一个最佳的比对。特别是对大的基因组一定要加这个选项,否则会异常慢
具体的参数可以通过delta-filter -h参看到

step3: generate figure using mummerplot

mummerplot -p <outpfix> <outpfix>.best_delta -t postscript

采用上一步过滤后的结果.best_delta画图,这里生成的是ps格式的图,虽然-t可以指定png图,但是结果显示生成的png图分辨率太低。

step4: convert ps format to png

/usr/bin/ps2pdf <outpfix>.ps <outpfix>.pdf
convert -density 300 <outpfix>.pdf <outpfix>.png
#ps2pdf可以将ps格式的文件转pdf

convert是imagemagick包中的一个子程序,可以将pdf转为png图片,而且清晰度高。

mummer还有一些其他用法。MUMmer是TRIG在1999年开发的,是最早的全局比对软件,因为之前序列都比较短,以局部比对软件为主。mummer的出现,让我们能一次比较不同物种两个完整基因组之间的差别。Mummer使用一种后缀树的算法,其比对速度快,资源消耗小。Mummer里面其实包含了很多分析工具。如基因组比对,共线性分析,同源序列搜索,重复序列查找,SNP和Indel检测等。这些工具搭配起来使用,可以完成非常多的工作。

show-snps 用于显示两样本的snp信息
show-aligns 用于显示比对,可以单独列出每个序列的比对情况。
show-coords 用于显示比对坐标,用于后续共线性分析定制化绘图
show-diff显示大的染色体变化 倍增 重排或者直接使用dnadiff软件一步生成,结果非常详细,还有一个report报告文件
dnadiff可以直接加-d接delta格式的结果(/opt/software/mummer-3.9.4alpha/dnadiff -d \<outpfix\>.delta),或者更方便直接接两条序列即可,非常方便好用。
  • 9
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值