- 博客(2)
- 资源 (6)
- 收藏
- 关注
原创 Spark之初学-01
Spark简介 Spark是起源于美国加州大学伯克利分校AMPLab的大数据计算平台,在2010年开源,目前是Apache软件基金会的较高级项目。随着Spark在大数据计算领域展露头角,也获取了越来越多的关注。2014年11月,Spark在Daytoya Gray Sort100TB Benchmark竞赛中打破了由Hadoop MapReduce保持的排序记录,Spark利用1/10的节点数,把...
2018-09-21 15:18:48 372
原创 Hive、Hbase的介绍
Hive Hive是基于Hadoop之上的数据仓库,可以通过使用类SQL的语句HQL来查询存放在HDFS上的数据;HQL是中类SQL语言,这种语言最终被转化为Map/Reduce,但是hive不能用于交互式查询;适用于海量离线数据的全量查询分析; Hbase...
2018-09-10 15:21:21 156
传输到hdfs数据,进行压缩
2019-02-13
Spark集群及相关生态链部署文档
2019-02-13
redis,解压即用
2019-02-13
eclipse.exe
2015-12-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人