![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
流云先生
这个作者很懒,什么都没留下…
展开
-
beeline常用的命令
<span style="font-size: 18px">Beeline和其他工具有一些不同,执行查询都是正常的SQL输入,但是如果是一些管理的命令, 比如进行连接,中断,退出,执行Beeline命令需要带上“!”,不需要终止符。常用命令介绍: 1、!connect url –连接不同的Hive2服务器 2、!exit –退出shell ...原创 2018-10-24 00:36:32 · 9658 阅读 · 0 评论 -
Hive基础
Hive基础1,命令行连接2,beeline连接https://blog.csdn.net/JENREY/article/details/79870864<property> <name>hadoop.proxyuser.bda.hosts</name> <value>*</value></prop...原创 2018-10-24 00:39:50 · 97 阅读 · 0 评论 -
Centos7基于Hadoop2.7.5安装hive2.3.3
1.下载hive2.3.3 下载地址:http://hive.apache.org/downloads.html 然后点击download 下载hive2.3.32.安装hive2.3.3 #解压: tar -zxvf apache-hive-2.1.1-bin.tar.gz #把解压后的文件移到目录/usr/local/下: mv apac...原创 2018-10-24 00:56:31 · 1302 阅读 · 0 评论 -
hive的基本概念
Hive基本概念1.什么是Hive? Hive:由Facebook开源用于解决海量结构化日志的数据统计 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能 本质是:将HQL转化成MapReduce程序 1.Hive处理数据存储在HDFS 2.Hive分析数据底层的实现Map Reduce 3.执行程序运行在YARN上...原创 2019-02-08 09:23:04 · 222 阅读 · 0 评论 -
hive的map join
Hive的map join 什么是Map Join?MapJoin顾名思义,就是在Map阶段进行表之间的连接。而不需要进入到Reduce阶段才进行连接。这样就节省了在Shuffle阶段时要进行的大量数据传输。从而起到了优化作业的作用。Map Join的原理?即在map 端进行join,其原理是broadcast join,即把小表作为一个完整的驱动表来进行join操作。通常情况下,要...原创 2019-03-28 15:31:24 · 1647 阅读 · 0 评论