mysql 海明距离_SQL中二进制字符串的汉明距离

小编典典

看来,将数据存储在BINARY列中是一种效果很差的方法。获得良好性能的唯一快速方法是将BINARY列的内容分为多BIGINT列,每列包含原始数据的8字节子字符串。

在我的情况下(32字节),这意味着使用4 BIGINT列并使用以下函数:

CREATE FUNCTION HAMMINGDISTANCE(

A0 BIGINT, A1 BIGINT, A2 BIGINT, A3 BIGINT,

B0 BIGINT, B1 BIGINT, B2 BIGINT, B3 BIGINT

)

RETURNS INT DETERMINISTIC

RETURN

BIT_COUNT(A0 ^ B0) +

BIT_COUNT(A1 ^ B1) +

BIT_COUNT(A2 ^ B2) +

BIT_COUNT(A3 ^ B3);

在我的测试中,使用这种方法比使用这种BINARY方法快100倍以上。

FWIW,这是我在解释问题时所暗示的代码。欢迎使用更好的方法来完成相同的事情(我特别不喜欢二进制>十六进制>十进制转换):

CREATE FUNCTION HAMMINGDISTANCE(A BINARY(32), B BINARY(32))

RETURNS INT DETERMINISTIC

RETURN

BIT_COUNT(

CONV(HEX(SUBSTRING(A, 1, 8)), 16, 10) ^

CONV(HEX(SUBSTRING(B, 1, 8)), 16, 10)

) +

BIT_COUNT(

CONV(HEX(SUBSTRING(A, 9, 8)), 16, 10) ^

CONV(HEX(SUBSTRING(B, 9, 8)), 16, 10)

) +

BIT_COUNT(

CONV(HEX(SUBSTRING(A, 17, 8)), 16, 10) ^

CONV(HEX(SUBSTRING(B, 17, 8)), 16, 10)

) +

BIT_COUNT(

CONV(HEX(SUBSTRING(A, 25, 8)), 16, 10) ^

CONV(HEX(SUBSTRING(B, 25, 8)), 16, 10)

);

2020-05-17

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值