实验四基于Matlab的序列比对分析
实验目的
1.了解MATLAB7.x生物信息工具箱中的序列比对方法;
2.熟悉从数据库获取序列信息,查找序列的开放阅读框,将核普酸序列转换为氨基酸序列,绘制比较两氨基酸序列的散点图,用Needleman-wunsch算法和Smith-Waterman算法进行比对,以及计算两序列的同一性的方法;
3.熟悉与序列比对相关的生物信息学函数。
所需软件
MATLAB7.0或MATLAB7.0以上的版本
实验内容
序列比对是生物信息学的重要基础。进行序列比对的目的之一是判断两个序列之间是否具有足够的相似性,从而判定二者之间是否具有同源性。序列比对的基本算法主要有两个,一个是用于全局比对的Needleman-Wunsch算法,另一个是主要用于局部比对的Smith-Waterman算法,而后者又是在前者的基础上发展起来的。在MATLAB生物信息工具箱中,序列比对主要用这两种算法。
确定两个序列的相似性是生物信息学的基础工作,通过序列比对(又称序列联配),可以确定两个序列是否具有同源性。
1.查找序列信息
Tay-Sachs症是一种由于缺乏?-氨基已糖苷酶A(Hex A)而导致的常染色体隐性遗传疾病。这种酶能分解大脑和神经细胞中的神经节苷脂(GM2)。基因HEXA编码该酶的?亚基,而第三个基因GM2A编码活化剂蛋白质GM2。
1.1查找目的基因Tay-Sachs
在NCBI(http://www.doczj.com/doc/4e59d2d60d22590102020740be1e650e52eacf3e.html)上查找信息,在Search列表中选择[Nucleotide],在for框中输入[Tay-Sachs],点击Go。