DNA基因鉴定----编辑距离DP

我们经常会听说 DNA 亲子鉴定是怎么回事呢?人类的 DNA 由 4 个基本字母{A,C,G,T}构成,包含了成千上亿个字符。如果两个人的 DNA序列相差 0.1%,仍然意味着有 300 万个位置不同,所以我们通常看到的 DNA 亲子鉴定报告上结论有:相似度 99.99%,不排除亲子关系。
怎么判断两个基因的相似度呢?生物学上给出了一种编辑距离的概念。
例如两个字符串 FAMILY 和 FRAME,有两种
对齐方式:
F   -   A   M   I   L   Y        -  F  A  M  I  L  Y
F   R  A   M   E                 F  R A  M  E

第 1 种对齐需要付出的代价:4,插入 R,将 I 替换为 E,删除 L、Y。
第 2 种对齐需要付出的代价:5,插入 F,将 F 替换为 R,将 I 替换为 E,删除 L、Y。
编辑距离是指将一个字符串变换为另一个字符串所需要的最小编辑操作。

怎么找到两个字符串 x[1,…,m]和 y[1,…,n]的编辑距离呢?

分析问题:

如果直接暴力枚举,可想而知需要运算的次数会随着字符串的增长而暴增,我们可以通过分析它是否具有最优子结构来决定能不能用动态规划。

假设的d[i][j]是X和Y的编辑距离最优解。那么不管两序列怎么对齐,都只可能有以下三种:

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值