【算法】汉明距离

汉明距离是以理查德·卫斯里·汉明的名字命名的。在信息论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。例如:
1011101 与 1001001 之间的汉明距离是 2。
2143896 与 2233796 之间的汉明距离是 3。
"toned" 与 "roses" 之间的汉明距离是 3。
 
 
例如:(00)与(01)的距离是1,(110)和(101)的距离是2。在一个码组集合中,任意两个编码之间汉明距离的最小值称为这个码组的最小汉明距离。最小汉明距离越大,码组越具有抗干扰能力。

计算汉明距离的算法

  思路:

  01.将两个给定的数进行 异或(^)运算后保存在变量a,汉明距离就是a的二进制中1的个数

  02.当a不为0时,和0x01进行 按位与(&)运算,如果结果为1,则统计变量加一

  03.将a右移一位,重复第02步

 

function hamDist($s1, $s2){
    $len1 = strlen($s1);
    $len2 = strlen($s2);
    if($len1 != $len2){
        return false;
    }
    $dist = 0;
    for($i = 0; $i < $len1; $i++){
        if($s1[$i] != $s2[$i]){
            $dist++;
        }
    }
    return $dist;
}

$s1 = "abcde";
$s2 = "acdeb";

echo hamDist($s1, $s2);// 输出4

  

/**
 * 计算编辑距离(Levenshtein Distance)
 *
 * @param string $s1
 * @param string $s2
 */
function levDist($s1, $s2){
    $len1 = strlen($s1);
    $len2 = strlen($s2);
 
    if($len1 == 0){
        return $len2;
    }
    if($len2 == 0){
        return $len1;
    }
 
    for($i = 0; $i <= $len1; $i++){
        $matrix[$i][0] = 0;
    }
    for($j = 0; $j <= $len2; $j++){
        $matrix[0][$j] = 0;
    }
    for($i = 1; $i <= $len1; $i++){
        $ch1 = $s1[$i - 1];
        for($j = 1; $j <= $len2; $j++){
            $ch2  = $s2[$j - 1];
            $temp = $ch1 == $ch2 ? 0 : 1;
            $arr = array(
                $matrix[$i - 1][$j] + 1,
                $matrix[$i][$j - 1] + 1,
                $matrix[$i - 1][$j - 1] + $temp
            );
            $matrix[$i][$j] = min($arr);
        }
    }
    return $matrix[$len1][$len2];
}

  

PHP的相似度计算函数:levenshtein 也用到该算法的实现

levenshtein(string1,string2,insert,replace,delete)

参数 

  • string1 必需。要对比的第一个字符串。
  • string2 必需。要对比的第二个字符串。
  • insert 可选。插入一个字符的代价。默认是 1。
  • replace 可选。替换一个字符的代价。默认是 1。
  • delete 可选。删除一个字符的代价。默认是 1。

转载于:https://www.cnblogs.com/songgj/p/8746585.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值