自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 布隆过滤器3——优化哈希策略的布隆过滤器

哈希函数在数据结构中很常见,实际数据结构中利用非常多,在布隆过滤器中有两种功能的哈希函数在布隆过滤器的位向量中,哈希函数将集合元素映射后作为位向量地址存储到位向量的某些位置上。当集合元素的数据类型和长度各不相同时,哈希函数可以将这些不同的数据统一映射为相同长度的二进制串(开发中常见的是使用MD5函数 ——无论输入的数据长度如何,都会得到长度相同的输出),也就是元素的指纹。这样一来,不论元素的实际数据类型如何,布隆过滤器都可以以统一的方式处理并存储这些元素。再通过这个元素进行地址映射哈希得到相应的存储地址。

2024-07-15 19:42:51 584

原创 布隆过滤器2——改进结构的布隆过滤器

之前介绍的优化方案()仅仅是对过滤器进行了结构上的拆分(分层型和分块型),并没有改变过滤器的本质,这导致这些优化方案只是改变了 BF 的操作逻辑,并没有改变具体操作过滤器的步骤和方法,也就只针对特定的应用场景优化了。本文将介绍 5 个改进结构的过滤器优化方案,它们从本质上改进了 BF 的结构,包括过滤器向量类型、过滤器扩展策略和哈希映射范围。

2024-07-13 19:58:15 709

原创 客户端-代理服务器--远程服务器的简单socket编程

客户端-代理服务器--远程服务器的简单编写。简单socket编程代码。

2024-07-12 21:48:28 130

原创 布隆过滤器——开发必会知识点

是一种用于快速判断一个元素是否属于集合的数据结构,其核心思想是通过多个哈希函数(散列函数)将元素映射到位数组中利用位数的唯一性来表示元素的存在性。标准BF的基本操作分为元素查找和元素插入。元素插入举例S1=100 , 哈希函数分别为h1=xmod7 ,h2=xmod9 h3=xmod6,S1通过哈希函数H1的结果是2,H2的结果是1 ,H3的结果是4。分别映射到位向量B的第2位第1位和第4位,使其存储结果由0变1。S2=50,S2通过哈希函数H2的结果是1,和S1一样,此时B中第1位结果仍然是1。

2024-07-12 21:42:34 1343

原创 动态数据——随时间变化滚动图数据。npy数据传输,json等的编程全过程

data = {

2024-06-12 21:31:11 370

原创 霍纳法则——高维聚合,高效查询,应用场景分析(提供python算法可复现)

对于多项式:计算计算开销为:平方(乘法计算)1+2+3+........+n需要次。加法: n次。点击此处乘法和加法开销都为n次。

2024-05-25 20:32:00 672 1

原创 隐私信息检索方案(PIR)——基于同态加密的PIR的实现安全查询。小白可复现

隐私信息检索是指在保护用户隐私的前提下,通过各种技术手段和方法来获取用户所需的信息。。

2024-05-21 17:06:15 1550 2

原创 python项目部署云服务器原理——小白必看git uwsgi nginx

项目部署原理

2024-04-21 21:10:10 714

原创 问卷调查,挖掘潜在用户,分类主成分分析SPSS操作

分类主成分利用最优尺度,主要利用了最优尺度变换,将其一律转换为量化评分进行分析得到了类别点的联合图。SPSS数据需要为名义变量数据☞最优尺度☞所有变量为名义变量(注意如果你选多个数据集将采用的不是分类主成分分析法)

2024-04-09 10:51:52 513

原创 PYTHON中socket使用循环接收数据时服务器等待

因为最后一次的数据长度没超过4096,c.recv(4096)将会一直等待除非客户端结束。PYTHON中socket使用循环接收数据时服务器等待。

2024-02-26 17:07:19 479 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除