序列比对
定义
序列比对(alignment):运用特定的算法找出两个或多个序列之间产生最大相似度得分的空格(空位)插入或序列排列方案。
分类
- 多序列比对:两条以上序列的序列比对
- 双序列比对:分为全局比对和局部比对
- 全局比对:用于比较两个长度近似的序列,常用Needleman-Wunsch算法
- 局部比对:用于比较一长一短两条序列
用途
- 确定:一个未知序列是否属于某个家族
- 建立:系统发生树,查看物种间或序列序列间的关系
- 模式识别:一些特别保守的序列片段往往对应重要的功能区域,通过多序列比对,可以找到这些保守片段
- 已知推未知:把已知有特殊功能的序列片段通过多序列比对做成模型,然后根据模型推测未知的片段序列是否也具有功能
- 其他:预测蛋白质/RNA二级结构
## 比较COVID19与SARS、MERS序列的相似性
from Bio import SeqIO
## 数据来源