Hive语法（一）

最新推荐文章于 2024-08-07 10:49:21 发布

ZoeYen_

最新推荐文章于 2024-08-07 10:49:21 发布

阅读量432

点赞数

本文链接：https://blog.csdn.net/ZoeYen_/article/details/79809423

版权

本文详细介绍了HiveQL的表操作，包括创建内外部表、改变表结构、加载数据、插入数据及查询操作。同时，讲解了视图创建、索引操作以及分区操作，包括如何创建、管理、使用索引和分区，以提高数据处理效率。

摘要由CSDN通过智能技术生成

HiveQL与关系型数据库的SQL 略有不同，但支持了绝大多数的语句如DDL、DML 以及常见的聚合函数、连接查询、条件查询。HIVE不适合用于联机(online)事务处理，也不提供实时查询功能。它最适合应用在基于大量不可变数据的批处理作业。

（一）表操作

建表规则：

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name
[(col_name data_type [COMMENT col_comment], …)]
[COMMENT table_comment]
[PARTITIONED BY (col_name data_type [COMMENT col_comment], …)]
[CLUSTERED BY (col_name, col_name, …)
[SORTED BY (col_name [ASC|DESC], …)] INTO num_buckets BUCKETS]
[ROW FORMAT row_format]
[STORED AS file_format]
[LOCATION hdfs_path]

①CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在，则抛出异常；用户可以用 IF NOT EXIST 选项来忽略这个异常。

②EXTERNAL 关键字可以让用户创建一个外部表，在建表的同时指定一个指向实际数据的路径（LOCATION）。

③LIKE 允许用户复制现有的表结构，但是不复制数据。

④COMMENT可以为表与字段增加描述

⑤ROW FORMAT DELIMITED [FIELDS TERMINATED BY char] [COLLECTION ITEMS TERMINATED BY char]
[MAP KEYS TERMINATED BY char] [LINES TERMINATED BY char]

| SERDE serde_name [WITH SERDEPROPERTIES
(property_name=property_value, property_name=property_value, …)]

ROW FORMAT DELIMITED 指定用户创建表加载数据时，支持的列分隔符。

用户在建表的时候可以自定义 SerDe （序列化）或者使用自带的 SerDe。如果没有指定 ROW FORMAT 或者 ROW FORMAT DELIMITED，将会使用自带的 SerDe。在建表的时候，用户还需要为表指定列，用户在指定表的列的同时也会指定自定义的 SerDe，Hive 通过 SerDe 确定表的具体的列的数据。

⑥STORED AS

SEQUENCEFILE

| TEXTFILE

| RCFILE

| INPUTFORMAT input_format_classname
OUTPUTFORMAT output_format_classname

如果文件数据是纯文本，可以使用 STORED AS TEXTFILE。如果数据需要压缩，使用 STORED AS SEQUENCE 。

1.创建一个内部表student1
这里写图片描述

2.创建一个外部表teacher2
这里写图片描述

3.删除表

先创建一个test表
这里写图片描述
删除

4.改变表结构
这里写图片描述
5.改变表名

最低0.47元/天解锁文章

ZoeYen_

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hive语法（一）

一、DDL操作HiveQL与关系型数据库的SQL 略有不同，但支持了绝大多数的语句如DDL、DML 以及常见的聚合函数、连接查询、条件查询。HIVE不适合用于联机(online)事务处理，也不提供实时查询功能。它最适合应用在基于大量不可变数据的批处理作业。（一）创建表建表规则： CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_nam...
复制链接

扫一扫

专栏目录