写在前面
Mapman 是一款为植物通路分析专门设计的界面化软件,发表于2004年,其后不断更新,直到今日。我们也常常能在近期发表的一些文章中看到 Mapman 输出图稿的身影。在几年前,我写了系列 Mapman 软件使用指南,其后看到国内其他公众号或网课平台也发布类似内容。从某种角度来说,都推广了Mapman的使用。
甚至有人误以为我参与了Mapman的开发。很遗憾,我没有这个机会,似乎也没有这个能力。不过,在软件使用上,我还是一下子就掌握的。Mapman使用的开始,需要对物种全基因组的蛋白序列进行Mapman注释。官方提供了在线注释工具,但似乎很多人并不能快速找到或者掌握,尽管几年前我就写过教程。正好这两天,在分析点数据,需要注释一个物种,也就记录一下。希望对大伙多少有点帮助。
输入序列的准备
个人建议,直接从基因组序列中,依据基因结构注释信息,提取全基因组的蛋白序列,可以使用 TBtools 的 GXF Sequence Extract 功能。当然,直接从官网下载该物种的蛋白序列全集,也是可行。
开始注释
打开网页
https://www.plabipd.de/portal/mercator4
选择蛋白序列文件
点击 Submit Job 等到即可
如此,提交了任务。当任务完成时,即可看到下述页面
可以看到,很快就完成了
猜想现在估计不是用Blastp?而是使用ghostz或者diamond的Blast加速版本?当然,这个我们基本不用关心了。
其中 “Mercator4 annotation results” 下载解压后,可以直接用于 Mapman 软件导入。老毛病没改过来
对于Mapman annotation 中的序列ID,全都被自动转换成小写。这点是Mapman使用的最大坑,亦即表达矩阵最好也是全部ID转换成小写。
而 Fasta file,则是原始输入的Fasta文件,在 ID 部分增加了注释信息,说实话,还是很人性了。
写在最后
Emmm,总的来说,超级简单。但一直以来还是会有人被这个难倒。或许有些事情,就是会者不难,难者不会?
TBtools,可能也是一样吧。