前言
布隆过滤器 Bloom Filter在很多博客中的有提到,但是我希望在本篇博客中按照我的理解将Bloom Filter尽量简单的呈现出来。其实从人类起源开始,人类就在尝试利用语言来描述世界,而语言恰恰是人与人之间交流的重要工具,例如,A告诉B“苹果”,B立刻能够想象出苹果的形状、颜色、作用、苹果公司、乔布斯等信息。显然易见,通过传递简单的两个字,人与人之间传递了大量事先已知的信息。随着互联网的发展,计算机与计算机之间也需要通信,其实这个道理与人之间的通信有几分类似,只不过计算机与计算机之间是用数学的语言在交流。
那么我们就用数学的语言来举一个例子:下面有许多整数,请用汉字来描述这些数字
1,一
101,一百零一
5631388,五百六十三万一千三百八十八
4135722879431564769231343136422521533547654,(说实话,我不知道怎么用汉字来描述这个整数)
接下来,我们要来分析一下上述例子暴露出来的问题。
1)这是一个和计算机类似的系统吗?
是,整数如101,实际上是这个系统的输入值;而汉字如“一百一”是输出值。那么,人脑这时候就是这个系统,研究这个系统如何工作可以帮助我们构造出计算机的方法。
2)那么,人脑是如何工作的呢?
刚出生的小孩可以是通过死记硬背的方法来记住这样的对应关系,如同我们背诵九九乘法口诀一样。显然,我们不可能通过这样的方法计算所有可能存在的整数。长大之后,老师我教我们按照一定的规律去记忆,于是我们知道了下述规则:
首先,我们知道“个”,“十”,“百”,“千”,“万”,“亿”,通过组合,我们可以表述任意个位数到亿亿位数之间的整数。随着我们对数学的理解,我们知道这个描述整数的方法叫做十进制。
其次,我们发现有的大的整数其实我们不知道应该怎么描述,例如上述的第四个例子。但是仿佛这并没有对我们生活造成多大的影响。
综合上述,我们可以做出如下的概括。形容自然界中所有的整数,我们可以采用一个通用的方法,即十进制。这种通用方法是将整数映射到一组用来描述的数字组合