计算两个字符串之间的编辑距离【支持多字节字符串】

/**
 * 计算两个字符串之间的编辑距离【支持多字节字符串】
 *
 * @param string $str1 求编辑距离中的其中一个字符串
 * @param string $str2 求编辑距离中的另一个字符串
 *
 * @return int
 */
function levenshtein_copy(string $str1, string $str2): int
{
    $arr1 = mb_str_split($str1);
    $arr2 = mb_str_split($str2);

    $len1 = count($arr1);
    $len2 = count($arr2);

    $num = 0; // 最小编辑距离
    $len = $len1 > $len2 ? $len1 : $len2; // 最长字符串长度

    // 删除相同字符
    for ($i = 0, $a = 0; $i < $len1; ++$i) {
        for ($j = $a; $j < $len2; ++$j) {
            if (isset($arr1[$i]) && isset($arr2[$j]) && $arr1[$i] === $arr2[$j]) {
                $a = $j;
                unset($arr1[$i]);
                unset($arr2[$j]);
                break;
            }
        }
    }

    // 计算最小编辑距离
    for ($i = 0; $i < $len; ++$i) {
        if (isset($arr1[$i]) && isset($arr2[$i])) {
            ++$num; // 替换
        } elseif (isset($arr1[$i])) {
            ++$num; // 删除
        } elseif (isset($arr2[$i])) {
            ++$num; // 插入
        }
    }

    return $num;
}

v(levenshtein_copy('bbcde', 'abdbe'));
v(levenshtein_copy('吉林宝源', '林宝源丰'));

执行结果:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值