近似查询mysql_近似查询处理简介

什么是近似查询处理?

近似查询处理,英文全称Approximate Query Processing,是针对SQL聚集查询结果进行估计的技术。举一个简单的例子,假设我们要查询数据库中表A的某一列a的均值,则SQL语句如下:

SELECT AVG(A.a) FROM A

如果数据库所存放的数据的数量十分庞大,要完成完整查询,则会需要花费较长的时间。如果我们使用近似查询技术,就可以以采样的方式,对均值的结果进行估计,以一定的精度损失,快速的获取对精确值的估计。这在某些场景下,会有一定的应用。不止是COUNT,SUM,AVG等常用的聚集估计方法都可以得到支持。除了简单的查询之外,近似查询还可以处理关联查询(join),嵌套查询,范围查询等复杂查询场景。

近似查询处理主要关注点有两个方面:

如何在庞大的数据中获取样本

如何根据样本选择合适的样本估计技术

在这个专题中,我将针对近似查询处理的学术论文,对近似查询处理技术进行一个完整的总结,同时也会对数据库技术。在专题中,涉及到的论文是在SIGMOD2017数据库国际顶级会议上发表的一个keynote演讲文章总结的,该keynote的名字是Approxiamte query processing:No silver bullet。这篇文章是你对近似查询处理技术的一篇综述性文章,涉及面很广。,这个链接是微软提供了文章下载地址,因为keynote演讲者是微软研究人员Surajit Chaudhuri,其是近似查询技术的主要推动者,感兴趣的读者可以去先读一下这篇文章。此外,另外一片发表在springer上的综述论文,也对近似查询技术进行一定的总结,名字是:Approximate Query Processing: What is New and Where to Go?。在以上两篇文章中,还提到了在2017年之前发表的一些关于近似查询技术的综述性文章。阅读这些文章,有助于了解这项技术的始末。

在接下来的文章中,我会首先切入近似查询处理的第一篇文章:Random samping from database,这是一篇发表在80年代的博士论文,首次系统的介绍了这一个方法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值