比较字符串相似度 Levenshtein

Levenshtein是编辑距离,在自然语言处理中很常见。

# coding=utf-8
def Levenshtein(s, t):
    len_s = len(s)
    len_t = len(t)

    temp = [[0 for i in range(0, len_t+1)] for j in range(len_s+1)]
    # print(temp)
    # 将第一行和第一列初始化 0,1,2,3,。。。
    for i in range(len_s+1):
        temp[i][0] = i
    for i in range(len_t+1):
        temp[0][i] = i
    # 更新矩阵
    for i in range(1, len_s+1):
        for j in range(1, len_t+1):
            if s[i - 1] == t[j - 1]:
                flag = 0
            else:
                flag = 1
            temp[i][j] = min(temp[i - 1][j - 1] + flag,
                             temp[i][j - 1] + 1, temp[i - 1][j] + 1)
    print(temp[len_s][len_t] / (max(len_s, len_t)))
    for i in temp:
        print (i)
    print(temp[len_s][len_t])

if __name__=="__main__":
    # //要比较的两个字符串 
    Levenshtein("ddddsssss",'dddsssss')
   d  d  d  s  s  s  s  s
d [0, 1, 2, 3, 4, 5, 6, 7]
d [1, 0, 1, 2, 3, 4, 5, 6]
d [2, 1, 0, 1, 2, 3, 4, 5]
d [3, 2, 1, 0, 1, 2, 3, 4]
s [4, 3, 2, 1, 1, 2, 3, 4]
s [5, 4, 3, 2, 1, 1, 2, 3]
s [6, 5, 4, 3, 2, 1, 1, 2]
s [7, 6, 5, 4, 3, 2, 1, 1]
s [8, 7, 6, 5, 4, 3, 2, 1]

以上是python实现

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值