空间数据无处不在。每天,数以十亿计的gps设备,如手机、汽车、传感器,以及各种基于消费者的应用程序,如Uber、Tinder、Facebook、Twitter、Instagram等的位置标签帖子,都会产生大量的数据。空间数据的指数级增长导致研究界将重点放在构建能够有效处理空间数据的系统和应用程序上。与此同时,最近的研究引入了学习的指标结构。在这项工作中,我们使用了一种先进的多维索引结构(即Flood)提出的技术,并将它们应用到五个经典的多维索引中,以能够回答空间范围查询。通过调优每种分区技术以获得最佳性能,我们表明(i)在一个维度上使用过滤时,分区内的机器学习搜索比二进制搜索快11.79%到39.51%,(ii)树结构的瓶颈是索引查找,这可能通过线性化索引分区得到改善(iii)在一维上过滤并使用机器学习的索引进行精炼,比在二维上过滤的最接近的竞争对手快1.23到1.83倍,而且(iv)学习的索引可以对低选择性查询的性能产生显著影响,而在高选择性查询下效率较低。
The Case for Learned Spatial Indexes
最新推荐文章于 2024-07-20 20:04:43 发布