Python微信订餐小程序课程视频
https://blog.csdn.net/m0_56069948/article/details/122285951
Python实战量化交易理财系统
https://blog.csdn.net/m0_56069948/article/details/122285941
Fauce:Fast and Accurate Deep Ensembles with Uncertainty for Cardinality Estimation 论文解读(VLDB 2021)
- 本篇博客是对Fauce:Fast and Accurate Deep Ensembles with Uncertainty for Cardinality Estimation 论文的解读。原文链接为p1950-liu.pdf (vldb.org)
- 本文设计一种基于集成深度神经网络的基于查询的选择度估计器,文章的主要贡献有:
- 第一次设计实现了一种可以反映估计结果的不确定性的技术估计器。
- 介绍了一种新的查询特征化的方法,利用了数据库的连接模式捕获表列间的真是相关性。
- 在数学上定义了估计不确定性的含义,并通过设计实现集成深度神经网络实现了对估计结果的不确定性的评估。
- 通过不确定性管理模块可以通过增量学习进一步提高模型的准确性。
转化为回归问题
因为查询的基数均为实数,因此我们可以建立一个回归模型MMM。对于任意范围的查询语句,模型MMM可以产生匹配或接近实际基数值的回归结果。
模型MMM作为一个回归模型,其输入应为一个实值向量。因此我们必须将给定的查询语句转化为一个对应的实值向量,这个过程称为查询特征化。本文的查询特征化方法将在后文介绍。总之MMM将特征化向量作为模型的输入,实际的基数值作为标签进行训练以期望产生一个可以很好拟合query-cardinality映射关系的函数。
查询特征化
在训练MMM预测基数前,我们必须将查询语句转换成满足模型输入形式的实值向量。一个SQL查询语句可以表示成在本文中,它们中的每一个都用一个向量表示,这四个向量组合在一起就是一个查询语句的特征化向量&