Hive(1)：Hive基本命令行使用

宁宁可可

已于 2023-03-22 16:19:44 修改

阅读量2.9k

点赞数

分类专栏：数据库(MysqloracleMongo等) # 大数据文章标签： hive 数据仓库 hadoop

于 2021-03-08 21:00:15 首次发布

本文链接：https://blog.csdn.net/fen_fen/article/details/114549537

版权

数据库(MysqloracleMongo等) 同时被 2 个专栏收录

73 篇文章 3 订阅

订阅专栏

大数据

11 篇文章 0 订阅

订阅专栏

Hive介绍

Hive是一个在Hadoop中用来处理结构化数据的数据仓库基础工具，用来进行数据提取、转化、加载，可以存储、查询和分析存储在Hadoop中的大规模数据。它架构在Hadoop之上，总归为大数据工具，并使得查询和分析方便，hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行，Hive的优点是学习成本低，可以通过类似SQL语句实现快速MapReduce统计，使MapReduce变得更加简单。

Hive基本使用-命令行

[root@sparksvr1 bin]# whereis hive
hive: /home/qqq/apache-hive-1.2.2-bin/bin/hive.log /home/qqq/apache-hive-1.2.2-bin/bin/hive

[root@sparksvr1 bin]#cd /home/qqq/apache-hive-1.2.2-bin/bin

1.#进入hive

$hive

#注意：hive命令行语句后面一定要加分号

2.#查看所有数据库

hive> show databases;

OK

aaa

bbb

default

demo251

dl

dong

Time taken: 2.602 seconds, Fetched: 6 row(s)

3.#创建数据库

hive>create database demo251;

4.#使用数据库

使用数据库的时候可以输入：use databasename；

hive> use demo251;

OK

Time taken: 0.114 seconds

5.#删除数据库

hive> drop database if exists demo251;

OK

Time taken: 1.595 seconds

6.#创建表

create external table if not exists users_test(

    id int comment 'id value',

    name string comment 'name value',

    email string comment 'email value',

    age int comment 'age value',

    address string comment 'address value')

ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';

举例：

hive> create external table if not exists users_test(

    >     id int comment 'id value',

    >     name string comment 'name value',

    >     email string comment 'email value',

    >     age int comment 'age value',

    >     address string comment 'address value')

    > ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';

OK

Time taken: 0.182 seconds

参考创建表的语句：
Create [EXTERNAL] TABLE [IF NOT EXISTS] table_name
[(col_name data_type [COMMENT col_comment], ...)]
[COMMENT table_comment]
[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]
[CLUSTERED BY (col_name, col_name, ...) [SORTED BY (col_name [ASC|DESC],...)]INTO num_buckets BUCKETS]
[ROW FORMAT row_format]
[STORED AS file_format]
[LOCATION hdfs_path]

CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在，则抛出异常；用户可以用 IF NOT EXIST 选项来忽略这个异常。
EXTERNAL 关键字可以让用户创建一个外部表，在建表的同时指定一个指向实际数据的路径（LOCATION），Hive创建内部表时，会将数据移动到数据仓库指向的路径；若创建外部表，仅记录数据所在的路径，不对数据的位置做任何改变。在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据。
如果文件数据是纯文本，可以使用 STORED AS TEXTFILE。如果数据需要压缩，使用 STORED AS SEQUENCE 。
有分区的表可以在创建的时候使用 PARTITIONED BY 语句。一个表可以拥有一个或者多个分区，每一个分区单独存在一个目录下。而且，表和分区都可以对某个列进行 CLUSTERED BY 操作，将若干个列放入一个桶（bucket）中。也可以利用SORT BY 对数据进行排序。这样可以为特定应用提高性能。