![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
Gwynbleidddd
这个作者很懒,什么都没留下…
展开
-
Hive(三)Hive调优
Hive(四)Hive调优Fetch抓取本地模式Join小表Join大表(新版本中没有区别)多表关联大表join大表map端聚合Fetch抓取Hive中对于某些情况的查询可以不使用MapReduce计算。例如简单的select方法,Hive可以简单的读取对应的表并输出。通过设置hive-default.xml.template中的hive.fetch.task.conversion默认是more。设置属性为more后,全局查找,字段查找,limit查找都不走MapReduce。本地模式当存在很多原创 2020-11-08 19:42:57 · 56 阅读 · 0 评论 -
Hive(二)Hive中的表
参考文章:Hive(9) hive的分区表、外部分区表、分桶表Hive(三)Hive中的表数据都放到哪里了?数据仓库默认位置配置及库表关系内部表与外部表内部表外部表分库表与分桶表分库表分桶表数据都放到哪里了?既然Hive相当于一个连接数据与MR的接口,那数据都在哪里呢?答案是存放在HDFS中啦。我们创建的,读取的数据都是从HDFS中来的。查看我们所有数据所在的位置:通过登录mysql中存储的元数据进行查看。从上图可以看到我们之前创建的数据实际存储在下面的HDFS的URL之中。hdfs.原创 2020-11-08 17:38:00 · 1117 阅读 · 0 评论 -
Hive(一)Hive基本概念
Hive(二)Hive基本概念Hive概念Hive中的数据来源Hive中的元数据信息为什么要HiveHive的架构Hive概念Hive是一个数据仓库的处理工具,专门用于仓库的数据分析。Hive是基于hadoop上的一个数据仓库工具,将结构化的数据,映射成为一张表,并且提偶给你类似于sql的查询功能。Hive的本质是将SQL语句转换为MapReduce的任务进行执行。底层由HDFS来提供数据的存储支持,说白了hive可以理解为一个将SQL转换为MapReduce任务的工具,甚至更进一步可以说hive就是原创 2020-11-08 16:01:52 · 441 阅读 · 0 评论