- 博客(1)
- 收藏
- 关注
原创 阅读日记——“Making Queries Tractable on Big Data with Preprocessing”
在普通数据库中,我们可以采用一些直观的查询方法就能够很快的获得数据。能够在PTIME多项式时间,内得到回应的查询,我们称之为是可处理的查询。而在大数据中,我们需要一些额外的策略让数据的查询变得可处理。为什么?若我们有一个1PB的数据集,假设使用扫描速度为6GB/s的硬盘进行线性扫描,那么所需要的时间是1.9天。所以我们就可以采用构建索引的方式,把成本放在预处理中,这样规避线性扫描,可以在几秒内获得结果。例1.假设我们有一个查询类(
2023-09-19 21:37:04
52
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人