美国国家生物技术信息中心(National Center of Biotechology Information ,NCBI) 充分利用Internet ,为用户提供了丰富的生物信息资源。NCBI 的BLAST 程序是进行核酸序列和蛋白质序列相似性比较的优秀工具。
1 BLAST简介
NCBIBLAST(Basic Local Alignment Search Tool ,局部对比基本检索工具) 是将核酸序列或蛋白质序列与可用的序列数据库进行相似性比较的一系列程序。其核心是程序BLAST210。BLAST是一个寻找序列间具有相似性的区段,进而比较它们之间结构和功能的工具,而不是仅仅比较整个序列的同源性。BLAST的应用范围相当广泛,适用于核酸或蛋白质序列与可用的序列数据库之间的比较,也可用于几个序列间的比较:核酸- 核酸、核酸- 蛋白质、蛋白质- 蛋白质之间。NCBI 的BLAST 提供了网页、电子邮件以及FTP 三种方式进行序列分析,使用十分方
便。
2 各种BLAST介绍
BLAST经过不断发展完善,有以下几种类型:
2.1 Nucleotide BLAST
Nucleotide BLAST是输入核酸序列,用这些序列与其它核酸序列比较。
2.1.1 Standard nucleotide - nucleotide BLAST(标准核酸- 核酸BLAST) :以三种格式(FASTA 格式、GenBank Accession 编码或GI编码) 的核酸序列与NCBI 核酸序列数据库作比较。
2.1.2 MEGABLAST:该程序使用“模糊算法”加快了比较速度,可以用于快速比较两大系列序列。
2.1.3 Search for short , nearly exact sequences (近似的短序列检索) :该检索和带有默认参数的Standard nucleotide - nucleotideBLAST很相似,是以短序列进行检索。
2.2 Protein BLAST
Prote