第二周 序列比对
第二周 序列比对序列比对中的基本概念每种方法掌握的框架·Biology·Data·Model·Algorithm序列比对(Sequence Alignment)生物学问题 Biological Question:序列比对的意义 Why is it important?具体实例总结问题 Summary Questions利用动态规划进行全局比对 Global Alignment by Dynamic ProgrammingPairwise Sequence Alignment: in MathsSequence Alignment: Enumerate?Sequence Alignment: What is the computational Algorithm?动态规划 Dynamic ProgrammingSequence alignment with Dynamic Programming: the Formula总结问题 Summary Questions从全局比对到局部比对考虑仿射空位罚分的序列比对,以及如何计算Needleman-Wunsch算法的时间复杂度讨论对于空位罚分的改进讨论一下全局比对算法的时间复杂性问题 总结思考 Summary Questions关于同源、相似性、相似性矩阵和点阵图HomologySimilarity vs IdentitySimilarity 电脑如何处理判断相似性Similarity MatrixPAM 1BLOSUM矩阵Dot matrix序列比对测试题
序列比对中的基本概念
每种方法掌握的框架
·Biology
-What is the biological question or problem?
·Data
-What is the input data?
-What other supportive data can be used?
·Model
-How is the problem formulated computationally?
-Or,what's the data model?
·Algorithm
-What is the computational algorithm?
-How about its performance/limitation?
对于每一类方法从以下几个方面来介绍:
首先,是Biology, 也就是这个方法要解决的生物学问题和背景是什么,或者说“为什么需要这个方法”。
其次,是Data,也就是说使用这个方法需要什么样的输入数据、以及哪些参数。
第三部分呢,会来介绍这个生物学问题是怎样被建模成为一个可以被计算机解决的计算问题, 也就是所谓的Model。
最后,会讨论具体来实现这个模型所需要使用的算法、其性能,以及其约束和限制。
序列比对(Sequence Alignment)
生物学问题 Biological Question:
"How can we determine the similarity between two sequences?"
序列比对的意义 Why is it important?
·Similar sequence →Similar structure →Similar function(The "Sequence-to-Structure-to-Function Paradigm")
·Similar sequence →Common ancestor("Homology")
首先呢,因为生物学中通常会有个观念,认为相似的序列可能会有相似的结构,从而有相似的功能。 所以这样子的话呢,序列之间的相似性就可以帮助我们推断这个未知新序列的可能的功能。 通过它已知的序列之间的相似性来进行这种推断。
其次,从演化的角度来看的话, 不同物种中相似的序列往往意味着其具有共同的祖先,也就是所谓的“同源”。 事实上,序列间的相似性是在演化分析中用来构建演化树的重要依据之一。 所以,从生物学的角度来说,序列比对的目的就是根据序列之间的功能或演化关系,来有效地检测序列之间的相似性。
具体实例
The purpose of a sequence alignment is to line up all residues in the inputted sequence(s) for maximal level of similarity, in the sense of their functional or evolutionary relationship.
通过网页工具实现序列比对。两个大框要输入两条蛋白序列。 把人类血红蛋白的α和β亚基的序列填进去。
注意:第一行