布隆过滤器

一、原理


哈希表:元素的值作为位数组的下标,位数组的长度取决于元素的最大值

布隆过滤器:将元素的值模取位数组的长度,多个哈希值决定一个元素的存在与否。

具体的看这里:http://www.cnblogs.com/allensun/archive/2011/02/16/1956532.html


二、例子

数组:int arr[] = { 1,2,3,4,5 };

需要两个参数

       数组长度:sz=5;     精确度:p=0.01;

根据公式

m=-(n*log(p) / (log(2)*log(2)))=75
k=0.7*(tmp_m / n)=7

1.根据参数构建布隆过滤器

class Bloom
{
public:
	Bloom(int n, double p)
	{
		double tmp_m = 0;
		double tmp_k = 0;
		tmp_m = -(n*log(p) / (log(2)*log(2)))+4; //根据精确度p计算位数组长度m
		tmp_k = 0.7*(tmp_m / n); //根据m,n的值计算哈希函数的个数k
		m = (int)tmp_m/8;//位数组转换成字符数组
		k = (int)tmp_k;
		arr = new char[m];
		memset(arr, 0, m);
	}
2.哈希
bool Hash(int d,bool key)
    {
        bool re = true;
        int i = 0;
        int num = d;
        int x = 0;
        int y = 0;
        for (i = 0; i < k; i++)
        {
            num = num*(i+1)+i;//根据i修改输入值,模拟多次独立哈希
            x = num%m; //元素模取字符数组长度,计算下标
            y = num%8; //元素模取8,计算偏移量
            if (key == true)
            {
                arr[x] = arr[x]|(1 << y);
            }
            if (key==false)
            {
                if ((arr[x] & (1 << y))!=(1<<y))
                {
                    re = false;
                }
            }
        }
        return re;
    }


3、测试

void test()
{
	int arr[] = { 1,2,3,4,5 };
	int sz = sizeof(arr) / sizeof(int);
	int i = 0;
	int d = 20;
	Bloom b(sz, 0.001);
	for (i = 0; i < sz; i++)
	{
		b.Set(arr[i]);
	}
	for (i = 1; i <= 200; i++)
	{
		cout << b.Find(i);
		if (i % 24 == 0)
		{
			cout << endl;
		}
	}	
}



因为布隆滤器的原理是将输入数据映射到长度为M的位数组上

所以数据以m(位数组长度)为周期分布,由于类型转和哈希函数的问题出现了6个错误数据

实际误差6/72大于预定的0.001误差


将k赋值为1,即只有一个哈希函数


误差为0小于0.001



三、完整代码

#pragma once
#include<iostream>
#include<cassert>
#include<cmath>
using namespace std;
class Bloom
{
public:
	Bloom(int n, double p)
	{
		double tmp_m = 0;
		double tmp_k = 0;
		tmp_m = -(n*log(p) / (log(2)*log(2)))+4;
		tmp_k = 0.7*(tmp_m / n);
		m = (int)tmp_m/8;
		k = (int)tmp_k;
		arr = new char[m];
		memset(arr, 0, m);
	}
	void Set(int d)
	{
		Hash(d, true);
	}
	bool Find(int d)
	{
		return Hash(d, false);
	}
protected:
	bool Hash(int d,bool key)
	{
		bool re = true;
		int i = 0;
		int num = d;
		int x = 0;
		int y = 0;
		for (i = 0; i < k; i++)
		{
			num = num*(i+1)+i;
			x = num%m;
			y = num%8;
			if (key == true)
			{
				arr[x] = arr[x]|(1 << y);
			}
			if (key==false)
			{
				if ((arr[x] & (1 << y))!=(1<<y))
				{
					re = false;
				}
			}
		}
		return re;
	}
private:
	char*arr;
	int m;
	int k;
};
void test()
{
	int arr[] = { 1,2,3,4,5 };
	int sz = sizeof(arr) / sizeof(int);
	int i = 0;
	int d = 20;
	Bloom b(sz, 0.001);
	for (i = 0; i < sz; i++)
	{
		b.Set(arr[i]);
	}
	for (i = 1; i <= 200; i++)
	{
		cout << b.Find(i);
		if (i % 72 == 0)
		{
			cout << endl;
		}
	}	
}
int main()
{
	test();
	return 0;
}




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
概要介绍: 本课程主要是介绍并实战一款java中间件~redisson,介绍redisson相关的核心技术栈及其典型的应用场景,其中的应用场景就包括布隆过滤器限流器、短信发送、实时/定时邮件发送、数据字典、分布式服务调度等等,在业界号称是在java项目里正确使用redis的姿势。本课程的目标就在于带领各位小伙伴一起学习、攻克redisson,更好地巩固自己的核心竞争力,而至于跳槽涨薪,自然不在话下!  课程内容: 说起redisson,可能大伙儿不是很熟悉,但如果说起redis,想必肯定很多人都晓得。没错,这家伙字如其名,它就是架设在redis基础上的一款综合性的、新型的中间件,号称是java企业级应用开发中正确使用redis的姿势/客户端实例。 它是架设在redis基础之上,但拥有的功能却远远多于原生Redis 所提供的,比如分布式对象、分布式集合体系、分布式锁以及分布式服务调度等一系列具有分布式特性的对象实例… 而这些东西debug将在本门课程进行淋漓尽致的介绍并实战,除此之外,我们将基于spring boot2.0搭建的多模块项目实战典型的应用场景:对象存储、数据字典、短信发送、实时/定时邮件发送、布隆过滤器限流组件、分布式服务调度....课程大纲如下所示: 下面罗列一下比较典型的核心技术栈及其实际业务场景的实战,如下图所示为redisson基于订阅-发布模式的核心技术~主题Topic的实际业务场景,即实时发送邮件: 而下图则是基于“多值映射MultiMap”数据结构实战实现的关于“数据字典”的缓存管理: 除此之外,我们还讲解了可以与分布式服务调度中间件dubbo相媲美的功能:分布式远程服务调度,在课程中我们动手搭建了两个项目,用于分别充当“生产者”与“消费者”角色,最终通过redisson的“服务调度组件”实现服务与服务之间、接口与接口之间的调用!  课程收益: (1)认识并掌握redisson为何物、常见的几种典型数据结构-分布式对象、集合、服务的应用及其典型应用场景的实战; (2)掌握如何基于spring boot2.0整合redisson搭建企业级多模块项目,并以此为奠基,实战企业级应用系统中常见的业务场景,巩固相应的技术栈! (3)站在项目管理与技术精进的角度,掌握对于给定的功能模块进行业务流程图的绘制、分析、模块划分、代码实战与性能测试和改进,提高编码能力与其他软实力; (4)对于Java微服务、分布式、springboot精进者而言,学完本课程,不仅可以巩固提高中间件的实战能力,其典型的应用场景更有助于面试、助力相关知识点的扫盲! 如下图所示: 关键字:Spring Boot,Redis,缓存穿透,缓存击穿,缓存雪崩,红包系统,Mybatis,高并发,多线程并发编程,发送邮件,列表List,集合Set,排行榜,有序集合SortedSet,哈希Hash ,进阶实战,面试,微服务、分布式 适用人群:redisson学习者,分布式中间件实战者,微服务学习者,java学习者,spring boot进阶实战者,redis进阶实战者
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值