关于学习索引的总结

本文总结了多种学习索引技术,如Flood的多维索引优化,LISA的机器学习模型在空间数据上的应用,Tsunami解决的查询倾斜问题,PGM-index和FITing-Tree在动态字典索引的提升,以及ZM和HM模型在空间查询中的应用。此外,还探讨了ALEX、LIPP如何优化查找性能和内存占用,LIDER在大规模密集检索中的高效表现,以及LHist学习多维直方图的技术。这些方法通过结合传统的索引结构和机器学习,提升了数据检索的速度和精度。
摘要由CSDN通过智能技术生成

Flood是一个基于内存读取优先的多维索引,它通过联合优化索引结构和数据存储布局来自动适应特定的数据集和工作负载。Flood应用投影方法(space filling curve)将多维数据映射到1-d空间中,然后利用RMI实现多层递归索引。

LISA(Learned Index structure for Spatial dAta) 使用机器学习模型,通过几个精心设计的步骤,为任意空间数据集在磁盘页面中生成可搜索的数据布局. LISA由四部分组成:1)网格单元的表示,2)部分单调映射函数M(将空间键映射到一维映射值),3)单调分片预测函数SP(预测给定映射值的分片id并将映射空间划分为分片),4)局部模型(对磁盘页面进行分片内操作)

Tsunami 是一个学习的多维索引,对数据相关性和查询倾斜具有鲁棒性。Tsunami引入了两种模块化数据结构——网格树(grid Tree)和增强网格(Augmented grid)——使其在查询吞吐量和空间性能上分别超过现有的多维索引6倍和8倍

其中Tsunami是解决了LISA中数据相关性和查询偏斜问题。

The PGM-index 是一种用于全动态可索引字典问题的学习数据结构,它提高了查询/更新性能,并将传统和现代学习索引的空间占用提高了几个数量级。基于distribution-aware,compress,multicriteria的PGM-index

FITing-Tree利用数据分布构建分段线性函数,利用key值查到元组存储位置的索引结构。它合并了一个可调的错误参数,以允许DBA平衡查找性能和索引的空间消耗。这

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值