matlab 生物信息学工具箱,基于MATLAB生物信息学工具箱构建分子系统发生树

医学信息学杂志 年第 卷第 期 彻泌 , , ·医学信息研究基 于 生 物 信 息 学 工 具 箱 构 建 分子 系统 发 生 树 张乐平 黄 非 阂 波 李东方 第二军医大学计算机教研室 上海 摘要 分子水平的系统发生分析相对于经典系统发生方法更加科学、可靠。概述系统发生分析基础 , 详细介绍基于距 离的系统发生分析方法 , 相关实验表明 具有强大的数据处理能力和方便 实用的工具箱 , 便于系统发生分析的研究与应用。 〔关键词 〕 生物信息学 分子进化 系统发生树 肠 一尸鳍 , , 」乍打刀 , 咭 一 咭 , 印 材 呷 , 叮 £了, 鳍 了了, 〕 ‘ , , 一 」 , 〕 分子系统发生分析是生物信息学中一种研究进化的基本方法 , 一个可靠的系统发生推断将有助于对地球上不同物种进化关系的认识 。随着后基因组 时代的到来 , 从生物学领域到基因组学再到病毒学领域 , 进化树在解决生物学的很多重大问题上都有非常重要的意义〔‘〕。在国际学术界 , 已经被公 认 为 准 确 、可 靠 的科 学 计 算 标 准 软 件 。从首次增加 了引人注 目的生物信息学工具箱以来 , 如今的 版生物信息学工具箱的数据处理能力得到了极大的提升 。本文以生物信息学工具箱为基础 , 重点讨论利用 距离法构建分子系统发生树 。 〔收稿 日期 〕〔作者简介 〕 一 一 张乐平 , 副教授 , 主要研究方 向为计算机应用 、生物信息学 。 , 系统发生分析基础 系统发生学相关概念 系统发生学通过比较物种的特征研究生物形成或进化的历史 , 其研究结果以系统发生树表示 。系 统发生树是由节点和分支组成的一种二叉树 , 节点代表分类单元 物种或序列 , 而分支则表示物种之间的进化关系 。经典系统发生学主要通过形 态学和生理学途径获取生物的特征 , 并成功构建 了很多植物和动物的进化树 , 形成 了大量有价值 的生物学认识 。但是 , 依靠这样的生物表型特征进行研究是有局限的 , 例如 , 有些关系很远的生物 由于趋 同进化也会造成相似的表型 。 随着分子测序技术的飞速发展 , 分子序列数据呈指数级增长 , 进化论的研究进入分子水平 。分子序列数据常常可 以用一个有 限的字符集合来描述 , 例如 , 不论是细菌 、植物还是动物 , 序列都是由 、 、 、 种碱基组成 , 这样任何生物基于分子序列都可以进行 比较 。而且 , 分子序列 例如 的进化具有统计规律性 , 从而可以用严格的数学模型描述其变化 , 容易形成关于进化过程的可验性假设 。因此 , 分子水平的系统发生分析结果更加科学 、可靠 。 的插人变得等长 , 同源性得到更好的体现 。因此序列 比对是进行同源分析的一种基本手段 , 是分析序列之间差异的基础 。 序列比对的加权和可以根据常用的打分矩阵计算 , 如果分子序列是氨基酸序列 , 则用 矩阵 、 矩阵等 如果分子序列是 或者 , 则用 单 位 矩 阵 、核 昔 酸 转 换 — 颠 换 矩 阵 或 者 矩阵等 。距离计算 构建分子系统发生树的方法 用于在分子水平构建系统发生树的特征数据分成两类 。距离数据 分子序列之间的距离是指一个序列变化到另一个序列所需的最小变化数 目 , 常常用距离矩阵来描述 特征数据 表示能体现序列之间差异的分子水平的特征 。基于距离的构树方法呈现的是序列之间的整体差异 , 而基于特征的方法强调的是那些特殊的信息位点 。因为基于距离的方法和基于特征 的方法所采用 的分析有着本质上 的区别 , 所以它们关于进化关系结论的一致性可以看作是对一棵系

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值