- 博客(2)
- 收藏
- 关注
转载 CNCC 2016 | 南京大学黄宜华教授 50 张 PPT 剖析 Alluxio 及其应用
Alluxio 简介Alluxio(之前名为 Tachyon)是世界上第一个以内存为中心的虚拟的分布式存储系统。它统一了数据访问的方式,为上层计算框架和底层存储系统构建了桥梁。 应用只需要连接Alluxio即可访问存储在底层任意存储系统中的数据。此外,Alluxio的以内存为中心的架构使得数据的访问速度能比现有常规方案快几个数量级。在大数据生态系统中,Alluxio 介
2017-01-09 20:27:37 1793
原创 关于所使用的spark版本中的spark sql不支持exists和in等子查询语句的解决方案记录
stackoverflow上一篇很好的问题解答解决方法:SparkSQL doesn't currently have EXISTS & IN. "(Latest) Spark SQL / DataFrames and Datasets Guide / Supported Hive Features"EXISTS & IN can always be rewritt
2017-01-07 09:21:57 14196
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人