chapter3
apache parquet(列存储)
Apache Parquet 技术干货分享 - 简书 (jianshu.com)
chaper4
hadoop海量数据存储,分布式存储
spark实时处理
mapreduce 6过程
云中心->机架->server->vm->container->function
网格计算
RDD
narrow/wide dependencies
空间大数据Big spatial data
HadoopViz
b-tree b+tree R-tree
最小外接矩形MBR
构造R树,寻找最近的neighbor
MINDIST(p,R) MINMAXDIST: p到R的四条边的四个最大距离中的最小值
NN search pruning
Best-First
spatial join