Levenshtein distance

2 篇文章 0 订阅

Levenshtein distance



Levenshtein distance 简介
    Levenshtein distance,最短编辑距离,计算2个字符串的最短距离,即变换次数,
    规则为:
    1.修改一个字符
    2.增加一个字符
    3.删除一个字符
    任意一个操作,距离加1
算法
    定义一个矩阵,该矩阵matrix[i][j]代表着str1中的前i个字符到str2中的前j字符的最短距离。
    衍生的计算规则:
    1.matrix[i-1][j-1],如果str1的第i个字符等于str2的第j个字符,很显然有:
    matrix[i][j] = matrix[i-1][j-1] + (str1[i]==str2[j] ? 0 : 1)
    2.matrix[i][j-1],此时意味着str1的前i个字符串到str2的前j-1个字符串,那么添加一个字符即可,故有:
    matrix[i][j] = matrix[i][j-1] +1
    3.同理也有:
    matrix[i][j] = matrix[i-1][j] +1

    故状态转移方程:
    matrix[i][j] = minimum(matrix[i-1][j-1] + (str1[i]==str2[j] ? 0 : 1), matrix[i][j-1] +1, matrix[i-1][j] +1)
java实现
public class EditDistance {
    public static void main(String[] args) {
        String str1 = "speech";
        String str2 = "eechits";

        int distance = getEditDistance(str1, str2);
        System.out.print("最短距离: " + distance);
    }

    public static int getEditDistance(String str1, String str2) {
        int n = str1.length(); //str1的长度
        int m = str2.length(); //str2的长度
        int[][] matrix;
        char str1_i; //str1的第i个字符
        char str2_j; //str2的第j个字符

        if(n == 0) {
            return m;
        }
        if(m == 0) {
            return n;
        }

        matrix = new int[n+1][m+1];
        //构建矩阵的第一行与第一列
        for (int i=0; i <= n; i++) {
            matrix[i][0] = i;
        }
        for (int j=0; j <= m; j++) {
            matrix[0][j] = j;
        }
        for (int i=1; i <= n; i++) {
            //step1
            str1_i = str1.charAt(i - 1);
            for (int j=1; j <= m; j++) {
                //step2
                str2_j = str2.charAt(j - 1);
                matrix[i][j] = minimum(matrix[i][j-1] + 1, matrix[i-1][j] + 1, matrix[i-1][j-1] + ((str1_i == str2_j) ? 0 : 1));
            }
        }
        print(matrix, n ,m);
        return matrix[n][m];

    }

    public static int minimum(int a, int b, int c) {
        int mid = a > b ? b : a;
        return mid > c ? c : mid;
    }
    public static void print(int[][] matrix, int n, int m) {
        for (int i=0; i<=n; i++) {
            for (int j=0; j<=m; j++) {
                System.out.print(matrix[i][j] + " ");
            }
            System.out.println();
        }
    }
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值