VLDB summer school(一)近似查询处理1
有幸参加VLDB Summer School 2017,7天数据相关课程,收获良多,将知识记录并与大家分享。
一、近似查询处理(AQP)概括介绍
为什么研究AQP?
1. 数据集变得越来越大
2. 并不是所有查询都在乎高精度
3. 可参考研究成果易获得
4. 如果数据量变得庞大,精确查询花费将变得巨大
Let’s sample:
• A 1TB relation sale (sid, serialnum, price)
• A 50GB relation part (serialnum, partid, cost)
• A 5MB relation partinfo (partid, category)
But sampling not the only option for AQP.
Five types of methods in the literature :
1、 Histograms(直方图)