做竞赛项目用到了这个,看到网上只有C的实现,项目用的py想都一起写成py吧,于是用numpy写了一个。
参考:https://blog.csdn.net/jiaomeng/article/details/1619321
里面有几种不同的布隆筛(Bloom Filter & CBF & DCF)的C实现,很棒。
btw,上面的链接中那位博主提供的代码需科学上网才能下载
注:博主水平非常一般,有错误的话欢迎指正…
以下是源码:
import numpy as np
import mmh3
class DCF(set):
def __init__(self, m, x, y, k):
self.CBFV = np.zeros((m, x), dtype=np.bool)
self.OFV = np.zeros((m, y), dtype=np.bool)
self.hash_count = k
self.len = m
self.CBFV_bit = x
self.OFV_bit = y
def add(self, item):
for i in range(self.hash_count):
index = mmh3.hash(item, i) % self.len
count = compute(self.CBFV[index])
if (count == 2**self.CBFV_bit):
f = compute(self.OFV[index])
f += 1
self.OFV[index] = decompute(f, self.OFV_bit)
else:
count += 1
self.CBFV[index] =