第9周 Hive体系架构、安装与HiveQL，应用案例

最新推荐文章于 2021-07-03 18:03:06 发布

事后诸葛亮

最新推荐文章于 2021-07-03 18:03:06 发布

阅读量1.6k

点赞数

分类专栏： nosql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zq9017197/article/details/18304087

版权

nosql 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

Hadoop流

##wordcount的例子

bin/hadoop jar contrib/streaming/hadoop-0.20.2-streaming.jar -input input -output output -mapper /bin/cat -reducer /usr/bin/wc

注意，命令一定要写完整的路径

Hive 简介

数据仓库工具。可以把Hadoop下的原始结构化数据变成Hive中的表

支持一种与SQL几乎完全相同的语言HiveQL。除了不支持更新、索引和事务，几乎SQL的其它特征都能支持

可以看成是从SQL到Map-Reduce的映射器

提供shell、JDBC/ODBC、Thrift、Web等接口

Hive简介

起源自facebook由Jeff Hammerbacher领导的团队

构建在Hadoop上的数据仓库框架

设计目的是让SQL技能良好，但Java技能较弱的分析师可以查询海量数据

2008年facebook把hive项目贡献给Apache

Hive安装

内嵌模式：元数据保持在内嵌的Derby模式，只允许一个会话连接

本地独立模式：在本地安装Mysql，把元数据放到Mysql内

远程模式：元数据放置在远程的Mysql数据库

Hive安装：内嵌模式

1.下载

http://apache.dataguru.cn/hive/hive-0.8.1/hive-0.8.1.tar.gz

2.安装

(1)上传hive安装包到机器上,使用root用户登陆:

tar -xvf hive-0.8.1.tar.gz

(2)将解压的hive分别移动并改名为/usr/local/hive

rm -rf /usr/local/hive mv hive-0.8.1 /usr/local/hive

内嵌模式

3.配置hive

(1)修改/usr/local/hive/bin/hive-config.sh

在文件末尾加入

export JAVA_HOME=/usr/local/jdk export HIVE_HOME=/usr/local/hive export HADOOP_HOME=/usr/local/hadoop

(2) 根据hive-default.xml复制hive-site.xml

cp /usr/local/hive/conf/hive-default.xml /usr/local/hive/conf/hive-site.xml

(3)配置hive-site.xml,主要配置项如下:

hive.metastore.warehouse.dir：（HDFS上的）数据目录

hive.exec.scratchdir：（HDFS上的）临时文件目录

hive.metastore.warehouse.dir默认值是/user/hive/warehouse

hive.exec.scratchdir默认值是/tmp/hive-${user.name}

内嵌模式

以上是默认值，暂时不改。

(4)改变 /usr/local/hive的目录所有者为hadoop

chown -R hadoop:hadoop /usr/local/hive

(5)配置hive的log4j:

cp /usr/loca/hive/conf/hive-log4j.properties.template /usr/loca/hive/conf/hive-log4j.properties

修改/usr/loca/hive/conf/hive-log4j.properties将org.apache.hadoop.metrics.jvm.EventCounter改为org.apache.hadoop.log.metrics.EventCounter

(6)启动hive

使用hadoop用户登陆,执行/usr/local/hive/bin/hive

Hive安装：独立模式

安装Mysql并启动服务

在Mysql中为hive建立账号，并授予足够的权限，例如hive账号，授予all privileges

用上述账号登陆mysql，然后创建数据库，比如名叫hive，用于存放hive的元数据

在本地安装mysql客户端

配置hive-site.xml文件，指出使用本地Mysql数据库，已经连接协议，账号、口令等

把mysql-connector-java-x.x.x.jar复制到hive的lib目录下

启动hive能进入shell表示安装成功

Hive安装：远程模式

在本地模式的基础上修改hive-site.xml文件，设置hive.metastore.local为false，并指向远程mysql数据库即可

Hive shell

执行HiveQL（大约相当于SQL 92标准）

查看或临时设置Hive参数，只对当前会话有效

创建函数

导入jar包

JDBC/ODBC接口

用户可以像连接传统关系数据库一样使用JDBC或ODBC连接Hive

目前还不成熟

JDBC的具体连接过程

1.使用jdbc的方式连接Hive，首先做的事情就是需要启动hive的Thrift Server,否则连接hive的时候会报connection refused的错误。

启动命令如下：

hive --service hiveserver

2.新建java项目，然后将hive/lib下的所有jar包和hadoop的核心jar包hadoop-0.20.2-core.jar添加到项目的类路径上。

样板代码

public static void main(String[] args) throws Exception {

// TODO Auto-generated method stub

Class.forName("org.apache.hadoop.hive.jdbc.HiveDriver");

String dropSql="drop table pokes";

String createSql="create table pokes (foo int,bar string)";

String insertSql="load data local inpath '/home/zhangxin/hive/kv1.txt' overwrite into table pokes";

String querySql="select bar from pokes limit 5";

Connection connection=DriverManager.getConnection("jdbc:hive://localhost:10000/default", "", "");

Statement statement=connection.createStatement();

statement.execute(dropSql);

statement.execute(createSql);

statement.execute(insertSql);

ResultSet rs=statement.executeQuery(querySql);

while(rs.next())

{

System.out.println(rs.getString("bar"));

} }

Web接口

假设hive部署在10.20.151.7机器上，conf/hive-default.xml文件都是默认值，那么我们直接在浏览器中输入：http://10.20.151.7:9999/hwi/ 就可以访问了

Hive的数据放在哪儿？

数据在HDFS的warehouse目录下，一个表对应一个子目录

桶与reduce

本地的/tmp目录存放日志和执行计划

事后诸葛亮

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

事后诸葛亮 CSDN认证博客专家 CSDN认证企业博客

码龄16年

610: 原创

9万+: 周排名

78万+: 总排名

171万+: 访问

: 等级

2万+: 积分

312: 粉丝

151: 获赞

83: 评论

505: 收藏

私信

关注

热门文章

分类专栏

最新评论

结果缓存函数
「已注销」: flgp
十八、C与GO混合编程
学海且无涯: 报错
十八、C与GO混合编程
学海且无涯: # _/C_/Users/Administrator/Desktop/ty C:/msys64/msys64/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/12.1.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/msys64/msys64/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/12.1.0/../../../libmingwthrd.a when searching for -lmingwthrd C:/msys64/msys64/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/12.1.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/msys64/msys64/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/12.1.0/../../..\libmingwthrd.a when searching for -lmingwthrd C:/msys64/msys64/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/12.1.0/../../../../x86_64-w64-mingw32/bin/ld.exe: skipping incompatible C:/msys64/msys64/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/12.1.0/../../../libmingwthrd.a when searching for -lmingwthrd C:/msys64/msys64/mingw64/bin/../lib/gcc/x86_64-w64-mingw32/12.1.0/../../../../x86_64-w64-mingw32/bin/ld.exe: cannot find -lmingwthrd: No such file or directory C:/msys64/msys64/mingw64/bin/../lib/gcc/x86_64
Datastage常用组件使用方法(详尽版)
销卢: 谢谢对我有所帮助
九、文本文件处理
cainiao_23333: 追加文件报错：写入文件错误： write D:/golang/a.txt: bad file descriptor 代码改为 f, err := os.OpenFile(path, os.O_APPEND|os.O_WRONLY, 6)

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。