生物信息就该这么学(5):其实就是比对那点事儿

在这里插入图片描述
今天继续我们的生物信息就该这么学内容,其实生物信息分析每天做的工作就是各种比对。序列比对可以说是整个生物信息的核心,因为你会发现几乎每个生物信息分析过程都需要用到序列比对。判断两个基因或两段基因组片段是否相似是序列分析的基本工作。从序列数据库搜索,序列拼接到基因蛋白质功能注释,以及进化树构建等,都依赖于分子序列相似性的比较,也就是序列比对。测序得到一段序列,判断它是否属于新冠病毒,需要与已知病毒序列进行比对。你可以会反问,基因组拼接,变异检测也用到序列比对了吗,答案是肯定的。

同源与相似

序列比对的核心作用就是判断是否同源。所谓同源(homology),是整个生物信息分析中最为重要的一个概念,只有同源的比对分析才是有意义的。同源也就是指来自于同一个祖先,两个物种从同一个祖先分化后,与不同的环境发生相互作用,其相应的DNA序列将各自发生一些替换或者插入缺失突变,也就是说序列不在精确相同。比如同一个大肠杆菌的祖先,经过不同的时间和空间的差异累积,最终就分化成不同类型的大肠杆菌。不同样品之间是同源的关系。

与同源概念想对应的是序列相似,相似性(similarity)和同源性(homology)是两个完全不同的概念。相似性仅仅是指字符串的相似 ,并不具有不具有生物学意义 ,因为DNA序列一共就有ATCG四种碱基,由于组合造成两段片段字符串组合比较接近。同源序列一般是相似的,但是相似的序列不一定同源。那么该如何判断序列是相似还是不相似,相似的序列是否满足同源关系呢。这些都需要序列比对来判断,并且使用一些方法和标准来进行评价。通常的解决方法是将两条

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值