在C#中,可以使用BitArray和Hash函数来实现布隆过滤器。下面是一个简单的示例:
using System;
using System.Collections;
public class BloomFilter
{
private BitArray filter;
private int[] hashSeeds;
private int size;
public BloomFilter(int size, int numHashes)
{
this.size = size;
this.filter = new BitArray(size);
this.hashSeeds = GenerateHashSeeds(numHashes);
}
public void Add(string item)
{
int[] hashes = GetHashes(item);
foreach (int hash in hashes)
{
filter[hash] = true;
}
}
public bool Contains(string item)
{
int[] hashes = GetHashes(item);
foreach (int hash in hashes)
{
if (!filter[hash])
{
return false;
}
}
return true;
}
private int[] GetHashes(string item)
{
int[] hashes = new int[hashSeeds.Length];
for (int i = 0; i < hashSeeds.Length; i++)
{
hashes[i] = GetHash(item, hashSeeds[i]);
}
return hashes;
}
private int GetHash(string item, int seed)
{
int hash = seed;
foreach (char c in item)
{
hash = (hash * 31) + c;
}
return Math.Abs(hash % size);
}
private int[] GenerateHashSeeds(int numHashes)
{
int[] seeds = new int[numHashes];
Random random = new Random();
for (int i = 0; i < numHashes; i++)
{
seeds[i] = random.Next();
}
return seeds;
}
}
使用示例:
BloomFilter filter = new BloomFilter(100000, 3);
filter.Add("apple");
filter.Add("banana");
Console.WriteLine(filter.Contains("apple")); // 输出:True
Console.WriteLine(filter.Contains("orange")); // 输出:False
在上面的示例中,BloomFilter类实现了布隆过滤器的基本功能。它使用一个BitArray来表示过滤器的位数组,使用一组Hash函数来生成多个哈希值,并使用这些哈希值在BitArray中设置对应的位。Add方法用于向过滤器中添加元素,Contains方法用于检查元素是否存在于过滤器中。
需要注意的是,布隆过滤器有一定的误判率,即可能会将不存在的元素误判为存在。在实际使用中,根据需求和数据量大小,需要合理选择过滤器的大小和哈希函数的个数,以控制误判率。