hive
zdy0_2004
这个作者很懒,什么都没留下…
展开
-
大数据学习系列之九---- Hive整合Spark和HBase以及相关测试
https://www.cnblogs.com/xuwujing/p/8322022.html前言在之前的大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 中介绍了集群的环境搭建,但是在使用hive进行数据查询的时候会非常的慢,因为hive默认使用的引擎是MapReduce。因此就将spark作为hive的引擎来转载 2018-01-22 00:00:48 · 1128 阅读 · 0 评论 -
Hive metastore整体代码分析及详解
https://www.cnblogs.com/yangsy0915/p/8456806.html 从上一篇对Hive metastore表结构的简要分析中,我再根据数据设计的实体对象,再进行整个代码结构的总结。那么我们先打开metadata的目录,其目录结构: 可以看到,整个hivemeta的目录包含metastore(客户端与服务端调用逻辑)、events(事件目录包含转载 2018-02-24 18:06:59 · 4681 阅读 · 0 评论 -
Hive(十)Hive性能优化总结
https://www.cnblogs.com/frankdeng/p/9463897.html一、Fetch抓取 1、理论分析 Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM employees;在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制台。 在...转载 2018-08-13 01:10:46 · 16081 阅读 · 4 评论 -
从oracle往greenplum迁移,查询性能不满足要求的定位以及调优过程
https://www.cnblogs.com/qiannianyuan/p/9463312.html目录一、前言 二、环境信息 三、优化过程 3.1 结果对比 3.2 分析过程 3.3 问题解决 3.4 最终结果 四、参考资料 回到顶部一、前言在一次对比oracle和greenplum查询性能过程中,由于greenplum查询性能...转载 2018-08-13 01:13:42 · 1220 阅读 · 0 评论