动态规划计算字符相似度感觉棒棒哒

# -*- coding: utf-8 -*-
"""
Created on 2015/7/7  10:08
使用动态规划算法实现编辑距离的计算
@author: Wang Xu
"""
import numpy as np


class LevenshteinDistance:
    def leDistance(self, input_x, input_y):
        xlen = len(input_x) + 1  # 此处需要多开辟一个元素存储最后一轮的计算结果
        ylen = len(input_y) + 1

        dp = np.zeros(shape=(xlen, ylen), dtype=int)
        for i in range(0, xlen):
            dp[i][0] = i
        for j in range(0, ylen):
            dp[0][j] = j

        for i in range(1, xlen):
            for j in range(1, ylen):
                if input_x[i - 1] == input_y[j - 1]:
                    dp[i][j] = dp[i - 1][j - 1]
                else:
                    dp[i][j] = 1 + min(dp[i - 1][j], dp[i][j - 1], dp[i - 1][j - 1])
        return dp[xlen - 1][ylen - 1]


if __name__ == '__main__':
    ld = LevenshteinDistance()
    print(ld.leDistance('瓦罐蹄膀饭', '瓦罐焖蹄饭'))  # Prints 2
    print(ld.leDistance('', 'a'))   # Prints 1
    print(ld.leDistance('b', ''))   # Prints 1
    print(ld.leDistance('', ''))    # Prints 0
    print(ld.leDistance('杭椒小炒肉面', '外婆小肉面'))  # Prints 3
    print(ld.leDistance('外婆小肉面', '杭椒小炒肉面'))  # Prints 3

  来自:http://codepub.cn/2015/07/07/Python-implementation-string-similarity-edit-distance/

转载于:https://www.cnblogs.com/xiaobaichuangtianxia/p/5749629.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值