目录
应用场景
一个元素是否存在于一个超大规模数据集中,比如爬虫场景下的URL去重
特点介绍
- 一个很长的位数组
- 一系列散列函数
- 空间效率和查询效率高
- 有一定的误判率
原理简介
- 添加元素时,将该元素进行K次hash运算,映射到K个位置,并把这些位置标位1
- 查询元素时,同样将该元素进行K次hash运算,如果有一个位置为0,代表该元素肯定不存在于集合中;如果都为1,那么判断该元素存在于集合中,但不一定真的存在,这里存在误判的情况
目录
一个元素是否存在于一个超大规模数据集中,比如爬虫场景下的URL去重