DISTILL: Low-Overhead Data-Driven Techniques for Filtering and Costing Indexes for Scalable Index Tuning
许多数据库系统提供了索引调优工具,帮助自动选择适当的索引以提高输入工作负载的性能。索引调优是一项资源密集型和耗时的任务,需要昂贵的优化器调用来估计潜在索引配置上的查询成本。本文开发了低开销的技术,可以被索引调优工具利用,在不更改调优算法或查询优化器的情况下,减少大量的优化器调用。首先,索引调优工具使用基于规则的技术生成大量语法相关的索引;然而,其中很大一部分索引是虚假的,并不能显著提高查询的性能。我们通过利用工作负载中的模式,在搜索的早期就消除了这些索引,而无需调用优化器。其次,学习成本模型,利用工作负载中查询和索引配置对之间的相似性,使用较少的优化器调用,有效地估计在大量索引配置上的查询成本。对真实世界和合成基准进行了广泛的评估,结果表明,给定相同的输入查询、索引和搜索算法进行探索,所提出的技术与最先进的调优工具相比,在推荐索引质量相似的情况下,调优时间的中位数减少了3倍,最多减少了12倍。