hive入门_hive demo-CSDN博客

本文链接：https://blog.csdn.net/wenwen360360/article/details/73732697

1、什么是hive

hive 是建立在Hadoop HDFS上的数据仓库基础架构
Hive可以用来进行数据提取转化加载（ETL）
Hive定义了简单的类似SQL查询语言，称为HQL它允许熟悉SQL的用户查询数据
hive允许熟悉MapReduce开发者的开发自定义的mapper和reducer来处理内建的mapper和reducer无法完成的复杂的分析工作
Hive是SQL解析引擎，他将SQL语句转移成M/R Job然后在Hadoop执行
Hive的表其实就是HDFS的目录／文件

2、Hive的体系结构

Hive的元数据

- hive将元数据存储在数据库中，支持mysql、derby、Oracle等数据库默认是derby

- hive中的元数据包括表的名字，表的列和分区及其属性，表的属性（是否为外部表等），表的数据所在目录等

一条HQL语句如何在hive中进行查询

HQL的执行过程

解释器、编译器、优化器完成HQL查询语句从词法分析、语法分析、编译、优化以及查询计划的生成。生成的查询计划存储在HDFS中，并在随后有MapReduce调用执行。

3、hive的安装

hive下载地址：

http://hive.apache.org/downloads.html

也可以在

http://archive.apache.org/

在这个链接下有apache的所有产品及其版本也包括了hive

我这里下载的就是hive的0.13.0版本

hive安装有三种模式

嵌入模式

-元数据信息被存储在hive自带的derby数据库中

-只允许创建一个连接

-多用于demo

本地模式

-元数据信息被存储在Mysql数据库中

-mysql数据库与Hive运行在同一台物理机器上

-多用于开发和测试

远程模式

将hive的安装包解压后，将mysql的connect 的jar包放入hive的Lib目录下，然后在hive的conf目录下新建

hive-site.xml文件，里面写上

<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<name>javax.jdo.option.ConnectionURL</name>

<value>jdbc:mysql://127.0.0.1:3306/你的数据库名称?characterEncoding=UTF-8</value>

</property>

<name>javax.jdo.option.ConnectionDriverName</name>

<value>com.mysql.jdbc.Driver</value>

</property>

<name>javax.jdo.option.ConnectionUserName</name>

<value>Mysql用户名</value>

</property>

<name>javax.jdo.option.ConnectionPassword</name>

<value>mysql用户密码</value>

</property>

</configuration>

然后hive就可启动了，注意在操作hive的时候一定要先启动Hadoop

4、Hive的管理

hive的启动方式

-CLI(命令行)方式

-Web界面方式

-远程服务启动方式

CLI(命令行方式)

-直接输入#<HIVE_HOME>/bin/hive的执行程序

-或者输入#hive --service cli

常用的CLI命令

清屏： Ctrl+L或者！clear
查看数据仓库中的表 -show tables;
查看数据仓库中内置的函数 -show functions;
查看表结构 -desc表名
查看HDFS上的文件 -dfs -ls目录
执行操作系统的命令 -！命令
执行HQL语句 -select ***from***
执行SQL的脚本 -source SQL文件

Web界面方式

-端口号9999

-启动方式：#hive --service hwi &

-通过浏览器来访问:http://<IP地址>:9999/hwi/

首先把jar包拷贝进入hive的lib下面：jdk中lib下的tools.jar 包 commons-el-1.0.jar ，jasper-runtime-5.5.23.jar ,jasper-compiler-5.5.23.jar，然后将apache-hive-0.13.0-src(hive源码)下的hwi打包成为war包 jar cvfM0 hive-hwi-0.13.0.war -C web/ .将打包好的war包拷贝到hive的lib下

然后在之前新建的hive-site.xml中添加

<name>hive.hwi.listen.host</name>

<value>0.0.0.0</value>（如果是本地就是0.0.0.0远程配置远程Ip）

</property>

<name>hive.hwi.listen.port</name>

</property>

</property>

然后在命令行中执行：

hive --service hwi命令即可

在浏览器上打开

localhost:9999/hwi/即可看到如下界面