Hive的基本操作（三）

最新推荐文章于 2024-01-25 17:40:11 发布

总是吃不饱

最新推荐文章于 2024-01-25 17:40:11 发布

阅读量2k

点赞数

分类专栏： hive 文章标签： Hive的基本操作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36508766/article/details/81320665

版权

本文详细介绍了Hive的DDL（数据定义语言）和DML（数据操作语言）操作，包括创建和管理库、表，以及数据的装载、插入、查询等。重点讨论了库和表的创建、修改、删除，以及分区表和分桶表的使用。此外，还涵盖了数据的加载、插入、导出和查询，以及Hive的JOIN查询操作。

摘要由CSDN通过智能技术生成

Hive的基本操作（三）

1.DDL操作

Hive的hql语句支持SQL一般语法，大致与SQL相似。

SQL语言包括四种主要程序设计语言类别的语句：

数据定义语言（DDL），数据操作语言（DML），数据控制语言（DCL）和事物控制语言（TCL）

DDL(Data Definitition Language):数据库模式定义语言

1.1.库操作

1.创建库：

CREATE (DATABASE|SCHEMA) [IF NOT EXISTS] database_name

[COMMENT database_comment] //创建库带注释

[LOCATION hdfs_path]

[WITH DBPROPERTIES (property_name=property_value, ...)]; //创建库指定属性

create databases dbname; / create databases if not exists dbname;

创建库的时候带注释：create database if not exists dbname comment 'create my db named dbname';

创建带属性的库 create database if not exists dbname with dbproperties ('a'='aaa','b'='bbb');

2.查看库

查看所有库：show databases;

显示数据库的详细属性信息语法：desc database [extended] dbname;

查看正在使用哪个库：select current_database();

3.删除库

删除库操作： drop database dbname; / drop database if exists dbname;

*默认情况下，hive 不允许删除包含表的数据库，有两种解决办法：

1、手动删除库下所有表，然后删除库

2、使用 cascade 关键字 drop database if exists dbname cascade;

默认情况下就是 restrict drop database if exists myhive ==== drop database if exists myhive restrict

4.切换库操作：语法：use database_name

1.2.表操作

1.创建表

CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name

[(col_name data_type [COMMENT col_comment], ...)]

[COMMENT table_comment]

[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]

[CLUSTERED BY (col_name, col_name, ...) [SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS]

[ROW FORMAT row_format] //指定分隔符

[STORED AS file_format]

[LOCATION hdfs_path] //指定表的数据存储路径

语法解析：

默认建表为内部表，加关键字EXTERNAL，新建为外部表，在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据。（ps:公共数据一般都是用外部表）

表的数据存储路径都是可以通过 location 指定的！！！！！！

推荐方式： 1、创建内部表的时候，最好别指定 location，就存储在默认的仓库路径 2、如果要指定外部路径，那么请创建该表为外部表

PARTITIONED BY：建分区表关键字

CLUSTERED BY ：建分桶表关键字 [SORTED BY (col_name [ASC|DESC], ...)] 指定每个桶的排序规则INTO num_buckets BUCKETS] 分的桶的个数

[ROW FORMAT row_format] 指定分割符：

列分割符：fields terminated by ' , '

行分割符：lines terminated by ' , '

元素分割符：items terminated by ' , '

[STORED AS file_format] 指定表中读取文件的类型默认 textfile

textfile 文本格式 rcfile 行列存储相结合的存储方式 sequencefile 二进制文件格式

LOCATION：指定数据文件存放的 HDFS 目录，不管内部表还是外表，都可以指定。不指定就在默认的仓库路径。

最佳实践：如果创建内部表请不要指定 location 如果创建表时要指定 location，请创建外部表。

列举四个类型表的建表示例：

内部表：

create table if not exists student(id int,name string,sex string,age int,department string) row format delimited fields terminated by ',' STORED as textfile ; //若指定了hdfs存储路径，则会覆盖配置文件中默认设置的目录路径

最低0.47元/天解锁文章

总是吃不饱

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

总是吃不饱 CSDN认证博客专家 CSDN认证企业博客

码龄8年

13: 原创

32万+: 周排名

85万+: 总排名

5万+: 访问

: 等级

427: 积分

13: 粉丝

14: 获赞

10: 评论

113: 收藏

私信

关注

热门文章

分类专栏

最新评论

Hadoop HA集群搭建
残留墨痕: dfs文件没有生产怎么弄
Linux之mysql的重新安装
学为以—: cp support-files/mysql.server /etc/init.d/mysqld cp: 无法获取'support-files/mysql.server' 的文件状态(stat): 没有那个文件或目录
Hive的基本操作（三）
xujun17_0: -- 解决方法：将hive设置成本地模式： -- set hive.exec.mode.local.auto=true; -- 再试试count（）函数就可以运行 --开启hive默认出于安全考虑，不允许使用union all. 如果你知道你在干什么，可以去设置允许使用。 set hive.strict.checks.cartesian.product=false; set hive.mapred.mode=nonstrict;[code=plain] [/code]
Hive的安装与配置（二）
代码小菜: hive有能在armlinux上安装的吗博主
Hive的安装与配置（二）
Akari0216: 请问下博主，hive-env.sh和hive-log4j2.properties不用配置麽？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。