6、生物序列比对:原理、方法与意义

生物序列比对:原理、方法与意义

1. 特定序列的检索

在检索特定基因或蛋白质序列时,由于GenBank数据库中序列数量庞大且索引复杂,即便遵循相关说明,检索工作也颇具难度。对于需要最新可用序列的项目,应搜索NR数据库;而其他项目则可借助如PIR和SwissProt等经过更好整理和注释的蛋白质序列数据库。此外,某些基因组数据库也能提供特定基因或蛋白质的序列。

Genpro数据库中的蛋白质序列由DNA序列自动翻译生成。当从mRNA序列的cDNA拷贝读取时,鉴于翻译起始位点存在一定不确定性,仍能提供可靠的序列。如今,许多蛋白质序列是通过基因组序列翻译预测得出的,这需要对编码区(外显子)进行预测,此步骤易出错。因此,需确定蛋白质序列条目的来源,若不是来自cDNA序列,可能需获取并测序该基因的cDNA拷贝。

2. 序列比对的定义

序列比对是比较两个(成对比对)或多个(多重序列比对)序列的过程,通过寻找序列中顺序相同的单个字符或字符模式来进行。将两个序列写在同一页面的两行上,相同或相似的字符置于同一列,不同的字符可作为错配放在同一列,或与另一序列的空位相对。在最优比对中,会合理放置不同字符和空位,使尽可能多的相同或相似字符垂直对齐。能以这种方式轻松比对的序列被认为是相似的。

序列比对主要分为全局比对和局部比对两种类型:
- 全局比对 :尝试对齐整个序列,尽可能使用每个序列两端之间的所有字符。适用于非常相似且长度大致相同的序列。例如,对于两个假设的蛋白质序列片段,全局比对会在整个序列长度上延伸,以包含尽可能多的匹配氨基酸,直至序列末端。序列间的竖线表示相同氨基酸的存在。即便存在明显的相同区域,全局比对可

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值