BLAST和FASTA应用【荐】.pdf
/cab/xueyuanxiashubumen/nx/bioinplant.htm 《生物信息学札记》 樊龙江
第三节 数据库相似性搜索引擎——BLAST 和 FASTA 应用
一. 数据之海与一叶轻舟
《科学》(science)杂志在 2001年2月16 日的人类基因组专刊(NO.5507)上
发表了一篇题为“生物信息学:努力在数据的海洋里畅游”的文章,文章写到:
“我们身处急速上涨的数据海洋中…我们如何避免没顶之灾?”一条可靠的办法
可能是赶紧找到“一叶轻舟”,而且在轻舟上装上先进的电子设备,诸如卫星定
位系统.卫星信息传输系统等等……BLAST 和 FASTA 便是这样的一条 “轻舟”往
来穿梭,速度奇快。
大多数研究目前都通过国际互联网 Internet 应用 NCBI 研制的 BLAST 程序
(Basic Local Alignment Search Tool)来进行DNA 和蛋白质序列相似性搜索。
用一组 BLAST 程序联配可以快速进行核酸和蛋白质序列库的相似性检索。采用
BLAST 的基本算法编成了若干各不同的程序,分别使用特定的序列库和用于特定
类型的输入序列。BLASTN 是在核苷酸序列库搜索核苷酸序列。BLASTP 是在蛋白
质序列库中搜索氨基酸序列。TBLASTN 则可以在核酸序列库中搜索氨基酸序列,
此时序列库在搜索之前要按所有 6 种读框即时翻译。与此相反的一项分析则由
BLASTX 来完成,它要将所输入的核酸序列按所有 6 种读框翻译,然后再以之搜
索蛋白质序列库。近期Altschul S.F.等人(1997 )提出了一个通过寻找蛋白质家</