关闭

单模板方法(single template strategy)

696人阅读 评论(0) 收藏 举报

Arita提出了单模板方法,实际上是把DNA计算中的编码问题归结为两个子问题:求的一个好的模板和一个纠错码集合。模板的性能决定了DNA序列的性能,因此在单模板方法中,如何求模板是关键的问题。

他提出了一个mass的概念,即模板的性能。定义mass的值为||x||=min(h(x,x),h(x,xr),HM(x,<xrxr>),HM(x,<xx>))。实际上mass的值为模板和自身连接以及自身的反连接之间的移位距离的最小值。因此mass的值从一定程度上反应了模板的性能,而且mass的值达到一定的要求对防止移位杂交有很大的好处。然后对于纠错码集合就是信息论里说的纠错码,理论上的大小为2L-m-1(L<=2m)。

根据二进制超立方体理论,通过mass值得到的模板集合中包括了序列的循环码,即一个模板通过循环移位可以得到另一个符合mass值的模板。因此我们认为这样的模板是等价的,在单模板集合中应该除掉这样的模板。假设模板的长度为L,那么一个模板的循环码集合的大小为2L,因为模板的反和模板共用一个模板集合。

有单模板方法的得到的DNA序列它的距离性质得到了保证。只要模板的mass值为d,纠错码集合的hamming距离为d,那么DNA序列之间至少在d个位置不同且包括自身和自身的反连接后得到的序列,当然这也包括了与之相对应的补序列。这样,在杂交反应中就可以大大的减少移位杂交的发生,同时也控制了二级结构的形成。

但是,单模板方法也有自身的缺点。细心的你一定可以发现,符合mass要求的单模板应该有很多个。在选取了一条模板的同时也排除了其它性能相近的模板。这样就造成了巨大的浪费,虽然对目前来说DNA序列是够用的,但是这样的方法DNA计算来说无疑是对资源的一种浪费。因此有学者在这个基础上提出了多模板方法。

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:4343次
    • 积分:81
    • 等级:
    • 排名:千里之外
    • 原创:4篇
    • 转载:0篇
    • 译文:0篇
    • 评论:1条
    文章分类
    文章存档