Hive学习笔记（三）——shell命令行

最新推荐文章于 2022-10-21 18:49:53 发布

0.07M

最新推荐文章于 2022-10-21 18:49:53 发布

阅读量438

点赞数 2

分类专栏： # hive 文章标签： HQL HIVE 大数据

hive 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1 hive与非交互式模式命令行

hive -e：从命令行执行指定的HQL，不需要分号：

hive -e ‘select * from dumy limit 100’ >a.txt

hive -f :执行HQL脚

hive -f /home/my/hive-script.sql

3） hive -i ：进入Hive交互Shell时候先执行脚本中的HQL语句

hive -i /home/my/hive-init.sql

4）hive -v ：冗余verbose，额外打印出执行的HQL语句；
5) hive -S：静默Slient模式，不显示转化MR-Job的信息，只显示最终结果

hive -S -e ‘select * from student

6)hive --hiveconf <property=value>：使用给定属性的值

HIVE_HOME/bin/hive --hiveconf mapred.reduce.tasks=2 //启动时,配置reduce个数2（只在此session中有效）

7)hive --service serviceName：启动服务

hvie --service hiveserver2

8)hive [–database test]：进入CLI交互界面，默认进入default数据库。加上[]内容直接进入test数据库。

hive --database test

2.Hive的交互模式下命令：

quit / exit：退出CLI

reset：重置所有的配置参数，初始化为hive-site.xml中的配置。如之前使用set命令设置了reduce数量。

set <key>=<value>：设置Hive运行时配置参数，优先级最高，相同key，后面的设置会覆盖前面的设置。

set –v：打印出所有Hive的配置参数和Hadoop的配置参数。

//找出和"mapred.reduce.tasks"相关的设置
hive -e 'set -v;' | grep mapred.reduce.tasks

add命令：包括add File[S]/Jar[S]/Archive[S] *，向 DistributeCache 中添加一个或过个文件、jar包、或者归档，添加之后，可以在Map和Reduce task中使用。比如，自定义一个udf函数，打成jar包，在创建函数之前，必须使用add jar命令，将该jar包添加，否则会报错找不到类。

list 命令：包括list File[S]/Jar[S]/Archive[S]。列出当前DistributeCache中的文件、jar包或者归档。

delete 命令：包括 delete File[S]/Jar[S]/Archive[S] *。从DistributeCache中删除文件.

//将file加入缓冲区
add file /root/test/sql;
//列出当前缓冲区内的文件
list file;
//删除缓存区内的指定file
delete file /root/test/sql;

create命令：创建自定义函数：hive> create temporary function udfTest as ‘com.cstore.udfExample’;

source <filepath>：在CLI中执行脚本文件。

//相当于[root@ncst test]# hive -S -f /root/test/sql
hive> source /root/test/sql;

! ：在CLI执行Linux命令。

dfs ：在CLI执行hdfs命令

3.保存查询结果の三种方式：

hive -S -e 'select * from dummy' > a.txt //分隔符和hive数据文件的分隔符相同

[root@hadoop01 ~]# hive -S -e "insert overwrite local directory '/root/hive/a'\ 
>  row format delimited fields terminated by '\t' --分隔符\t
>  select * from logs sort by te"

--使用hdfs命令导出整个表数据
hdfs dfs -get /hive/warehouse/hive01 /root/test/hive01

4.Hive集群间的导入和导出

使用Export命令会导出Hive表的数据表数据以及数据表对应的元数据

--导出命令
EXPORT TABLE test TO '/hive/test_export'

--dfs命令查看
hdfs dfs -ls /hive/test_export

--结果显示
/hive/test_export/_metadata
/hive/test_export/data

使用Import命令将导出的数据重新导入到hive中(必须将现导入的表重命名)

--导入到内部表的命令
IMPORT TABLE data_managed FROM '/hive/test_export'

--导入到外部表的命令
Import External Table data_external From '/hive/test_export' Location '/hive/external/data'

--验证是否是外部表
desc formatted data_external

5.Hive - JDBC/ODBC

在Hive的jar包中，"org.apache.hadoop.hive.jdbc.HiveDriver"负责提供 JDBC 接口，客户端程序有了这个包，就可以把 Hive 当成一个数据库来使用，大部分的操作与对传统数据库的操作相同，Hive 允许支持 JDBC 协议的应用程序连接到 Hive。当 Hive 在指定端口启动 hiveserver 服务后，客户端通过 Java 的 Thrift 和 Hive 服务器进行通信。过程如下：

1.开启 hiveserver 服务：

$ hive –service hiveserver 50000（50000）

2.建立与 Hive 的连接：

Class.forName(“org.apache.hadoop.hive.jdbc.HiveDriver”);  

Connectioncon=DriverManager.getConnection(“jdbc:hive://ip:50000/default,”hive”,”hadoop”)

默认只能连接到 default 数据库，通过上面的两行代码建立连接后，其他的操作与传统数据库无太大差别。

3.Hive 的 JDBC 驱动目前还不太成熟，并不支持所有的 JDBC API。

6.Hive Web Interface

1.配置hive-site.xml

  <property>
        <name>hive.hwi.war.file</name>
        <value>lib/hive-hwi-0.8.1.war</value>
        <description>This sets the path to the HWI war file, relative to ${HIVE_HOME}.</description>    
        </property>
        
        <property>
        <name>hive.hwi.listen.host</name>
        <value>0.0.0.0</value>
        <description>This is the host address the Hive Web Interface will listen on</description>
        </property>
        
        <property>
        <name>hive.hwi.listen.port</name>
        <value>9999</value>
        <description>This is the port the Hive Web Interface will listen on</description>
        </property>

2.启动Hive的Web服务：
　　hive --service hwi

3.在浏览器键入地址：http://host_name:9999/hwi访问

4.点击“Create Session”创建会话，在Query中键入查询语句

7. Hive创建数据库

hive启动后默认有一个Default数据库，也可以人为的新建数据库，命令：

--手动指定存储位置
create database hive02 location '/hive/hive02';

--添加其他信息(创建时间及数据库备注)
create database hive03 comment 'it is my first database' with dbproperties('creator'='kafka','date'='2015-08-08');

--查看数据库的详细信息
describe database hive03;
--更详细的查看
describe database extended hive03; 
--最优的查看数据库结构的命令
describe database formatted hive03;

--database只能修改dbproperties里面内容
alter database hive03 set dbproperties('edited-by'='hanmeimei');