COBALT的用法与结果分析
在线COBALT的网址可以在www.ncbi.nlm.nih.gov/tools/cobalt/
进入COBALT的界面如图1-A所示,跟Blast的界面是相似的,比较简单,也是用Fasta格式的序列,这里就不多讲了。在最下面”Advanced parameters”也可以设置比对的参数,一般来讲,默认的参数是保证结果质量和比对速度最优化的参数,乱改的话反而会使比对的性能下降。
图1-B所示是COBALT序列比对的结果,可以看出其中有条序列(XP_511495)跟其它序列的差别很大,使整个比对的结果多了好多Gap,并且打断了可能的蛋白结构域。由图1-C所知,XP_511495是一个预测的序列,这样的序列对序列比对是没有任何参考作用的,反而对比对的结果造成影响。
COBALT另一个好的功能就是可以把不好的序列去掉再重新比对,看图1C,把XP_511495前面的勾去掉,然后点击Re-align,这样多次的筛选与比对,才能达到精确的结果,看图1-D。
图 1. COBALT interface and multiple alignments.
从NCBI在线Blast结果运行COBALT
另外,也可以从在线Blast运行后的结果中再接着运行COBALT,这样子可以更容易地收集同源蛋白。例如以人的参考序列NP_000939为例做Blastp找bony fishes的同源蛋白,参数选择如下:Database = Reference proteins (refseq_protein); Organism = bony fishes;<