布隆过滤器区块链

布隆过滤器是一种概率数据结构,用于判断元素是否可能在集合中,适用于节省空间。它通过多个哈希函数将元素映射到二进制向量,存在误判但能确定一定不在的情况。在比特币中,Bloom Filter用于SPV节点筛选相关UTXO,保护隐私同时减少数据交换。
摘要由CSDN通过智能技术生成

布隆过滤器(Bloom Filter)是什么?
布隆过滤器(Bloom Filter)是 1970 年由布隆提出的,它实际上是由一个很长的二进制向量和一系列随意映射函数组成。

它是一种基于概率的数据结构,主要用来判断某个元素是否在集合内,它具有运行速度快(时间效率),占用内存小的优点(空间效率),但是有一定的误识别率和删除困难的问题。它能够告诉你某个元素一定不在集合内或可能在集合内。

为什么说可能在集合内而无法确定一定在集合内呢?而一定不在集合内为什么又能则可以百分百确定呢?下面我们通过分析布隆过滤器的原理来解释。

为什么需要布隆过滤器(Bloom Filter)?
在软件设计时,我们经常要判断一个元素是否在一个集合中。如:网络爬虫时,一个网址是否已经被访问过、一个邮件地址是否在黑名单中、在文字处理软件中某个英文单词是否拼写正确等。一个直接的方法是,将集合中的所有元素都存储在计算机中(如保存在链表、树、哈希表等数据结构)。当要判断一个新元素的时候,直接跟集合中的已存储元素对比即可判断元素是否在集合中。但是,当随着加入的数据量增加,我们需要存储元素的空间就越来越大,而且检索速度也会开始变慢。链表、树、哈希表的数据结构检索时间复杂度分别为:O(n)、O(logn)、O(n/k)。

举个例子,像 Gmail 这种邮件服务提供商,要过滤垃圾邮件。如果采用上面说的方法,将垃圾邮件加入到哈希表中,那至少要加入数十亿的垃圾邮件地址。没存储一个亿的 email 地址,就需要 1.6GB(将一个 email 地址转换成一个 8 字节的信息指纹并存入到哈希表中。由于哈希表的存储效率一般只有 50%&

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值