Hive的数据定义语言主要包括数据库和表的创建、修改与删除,此外表层面还有内部表与外部表、分区表等的操作。
Database
1.数据库的创建
1.1 创建语法
CREATE DATABASE [IF NOT EXISTS] database_name
# 数据库备注信息
[COMMENT database_comment]
# HDFS路径
[LOCATION hdfs_path]
# 数据库的一些参数信息
[WITH DBPROPERTIES (property_name=property_value, ...)];
其他注意事项:
1)Hive数据库在HDFS上的默认存储路径是:/user/hive/warehouse/*.db
2)创建一个数据库,可以指定数据库在HDFS上存放的位置:
- 指定的[LOCATION hdfs_path] 值就表示这个数据库在HDFS的位置
3)避免要创建的数据库已经存在错误,增加if not exists判断。(标准写法)
4)可以使用 use database;
切换当前数据库
1.2 查看数据库的基本信息
1)显示数据库
hive> show databases;
2)过滤显示查询的数据库
hive> show databases like 'db_hive*';
OK
db_hive
db_hive_1
3)显示数据库信息
hive> desc database default;
OK
db_name comment location owner_name owner_type parameters
default Default Hive database hdfs://hadoop102:8020/user/hive/warehouse public ROLE
Time taken: 0.072 seconds, Fetched: 1 row(s)
显示数据库详细信息:extended
hive> desc database extended default;
OK
db_name comment location owner_name owner_type parameters
default Default Hive database hdfs://hadoop102:8020/user/hive/warehouse public ROLE
Time taken: 0.069 seconds, Fetched: 1 row(s)
2.修改数据库
用户可以使用ALTER DATABASE
命令为某个数据库的DBPROPERTIES
设置键-值对
属性值,来描述这个数据库的属性信息。
数据库的其他元数据信息都是不可更改的,包括数据库名和数据库所在的目录位置。
hive (default)> alter database db_hive set dbproperties('createtime'='20170830');
在hive中查看修改结果:
hive> desc database extended db_hive;
db_name comment location owner_name owner_type parameters
db_hive hdfs://hadoop102:8020/user/hive/warehouse/db_hive.db zxy USER {
createtime=20170830}
3.删除数据库
1)删除空数据库
hive>drop database db_hive2;
2)如果删除的数据库不存在,最好采用 if exists
判断数据库是否存在
hive> drop database db_hive;
FAILED: SemanticException [Error 10072]: Database does not exist: db_hive
hive> drop database if exists db_hive2;
3)如果数据库不为空(不能直接删),可以采用cascade
命令,强制删除
hive> drop database db_hive;
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. InvalidOperationException(message:Database db_hive is not empty. One or more tables exist.)
hive> drop database db_hive cascade;
Table
1.创建表
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name
[(col_name data_type [COMMENT col_comment],