摘要
基数估计是数据库关系系统查询优化器的基础和核心. 随着人工智能技术的发展,其在数据处理、提取数据之间的关系等方面显现出优越的性能. 近年来,基于机器学习的基数估计技术取得了显著的进展,受到了学术界的广泛关注.
首先总结了基于机器学习的技术估计技术的发展现状,其次给出了基数估计的相关概念及其特征编码技术.接着建立了基数估计技术的分类体系.在此基础上,进一步将基于机器学习的基数估计技术细分为查询驱动、数据驱动和混合模型这3类基数估计技术.然后重点分析了每一类技术的建模流程、典型技术和模型特点,并对其在SQL和NoSQL中的应用进行了分析和总结.最后讨论了基于机器学习的基数估计技术面临的挑战和未来的研究方向.
内容简介