![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
文章平均质量分 72
Marho11
这个作者很懒,什么都没留下…
展开
-
FAILED: Error in metadata: MetaException(message:Got exception: java.net.ConnectException Call to ha
安装hive后,键入hive命令进入hive的shell命令行中,然后键入show databases;命令后显示:FAILED: Error in metadata: MetaException(message:Got exception: java.net.ConnectException Call to hadoop0/192.168.80.100:9000 failed on conn原创 2015-03-29 09:38:30 · 1477 阅读 · 0 评论 -
hive的远程模式安装(用mysql作为hive的元数据库)
主机ip(主机名):192.168.80.10(Master)192.168.80.11(Slave1)192.168.80.12()Slave2在主机Master中解压hive:tar –zxvf hive hive-0.9.0.tar.gz 设置环境变量,这里我用的是root用户修改/etc/profile文件。然后source /etc/profile原创 2015-09-19 20:10:38 · 7024 阅读 · 2 评论 -
Hive伪分布模式安装
1、安装和配置可以通过下载压缩包来安装一个稳定版的Hive,也可以下载源码进行编译。1.1 运行HiveServer2和Beeline1.2要求java1.7+,官网推荐1.8Hadoop2.x 1.3安装Hive的稳定版下载当前稳定版http://mirrors.cnnic.cn/apache/hive/hive-2.1.0/。解压缩,并重命名tar -zxv原创 2016-09-08 19:28:32 · 3683 阅读 · 1 评论 -
Hive管理表(内部表)数据加载及JOIN操作
> 数据加载数据准备: 在本地先创建两个txt文件:mahao@ubuntu:~$ cat user.txt 1,zhangsan2,lisi3,wangwumahao@ubuntu:~$ cat job.txt 1 工程师 12 美工 3 美工 4创建users表hive> CREATE TABLE IF NOT EXISTS users(id INT,name转载 2016-09-13 21:55:37 · 1077 阅读 · 1 评论 -
Hive分桶表及抽样查询
抽样查询对于非常大的数据集,用户不需要全部查询的结果,只需要一个代表性的查询结果时,可以通过对表进行分桶抽样。 Hive桶先介绍一下Hive桶。 桶是比表或分区更为细粒度的数据范围划分。针对某一列进行桶的组织,对列值哈希,然后除以桶的个数求余,决定将该条记录存放到哪个桶中。 好处: 1、获得更高的查询处理效率。 2、使抽样更高效。 创建带桶的table:create table原创 2016-09-14 17:12:28 · 10632 阅读 · 1 评论 -
Lateral View语法
语法lateralView: LATERAL VIEW udtf(expression) tableAlias AS columnAlias (',' columnAlias)* 数据准备假设我们有一张表pageAds,它有两列数据,第一列是pageid string,第二列是adid_list,即用逗号分隔的广告ID集合。mahao@ubuntu:~$ cat pageAds.txt "fro转载 2016-09-21 20:08:52 · 767 阅读 · 0 评论