![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hadoop
消灭八阿哥
皇子终结者,消灭八阿哥~
展开
-
presto集群与hadoop,hive集群整合
Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。 集群涉及到的插件有hdfs,hive。presto版本:presto-0.152.3,hadoop版本:hadoop-2.6.4,hive版本:hive-1.2.1,共三台集群。原创 2016-10-31 20:15:35 · 18569 阅读 · 1 评论 -
sparkstreaming
Spark Streaming实时计算框架介绍 随着大数据的发展,人们对大数据的处理要求也越来越高,原有的批处理框架MapReduce适合离线计算,却无法满足实时性要求较高的业务,如实时推荐、用户行为分析等。 Spark Streaming是建立在Spark上的实时计算框架,通过它提供的丰富的API、基于内存的高速执行引擎,用户可以结合流式、批处理和交互试查询应用。本文将详细介转载 2017-10-14 12:54:28 · 13669 阅读 · 0 评论