DDL 数据定义
1. 创建数据库
- 创建一个数据库,数据库在 HDFS 上的默认存储路径是
/user/hive/warehouse/*.db
create database db_hive if not exists;
- 创建一个数据库,指定数据库在 HDFS 上存放的位置
create database db_hive2 if not exists location '/db_hive2.db';
2. 查询数据库
2.1 显示数据库
- 显示数据库
show databases;
- 过滤显示查询的数据库
show databases like 'db_hive*';
2.2 查看数据库详情
- 显示数据库信息
desc database db_hive;
- 显示数据库详细信息
extended
desc database extended db_hive;
- 切换当前数据库
use db_hive;
3. 删除数据库
- 删除空数据库
drop database db_hive2;
- 如果数据库不为空,可以采用
cascade
命令,强制删除drop database db_hive cascade;
4. 创建表
- 建表语法
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] [CLUSTERED BY (col_name, col_name, ...) [SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS] [ROW FORMAT row_format] [STORED AS file_format] [LOCATION hdfs_path] [TBLPROPERTIES (property_name=property_value, ...)] [AS select_statement]
- 字段解释说明
CREATE TABLE
创建一个指定名字的表EXTERNAL
关键字可以让用户创建一个外部表,在建表的同时可以指定一个指向实际数据的路径LOCATION
,在删除表的时候,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删除数据COMMENT
为表和列添加注释PARTITIONED BY
创建分区表CLUSTERED BY
创建分桶表SORTED BY
不常用,对桶中的一个或多个列另外排序ROW FORMAT DELIMITED [FIELDS TERMINATED BY char]
(列分割符)[COLLECTION ITEMS TERMINATED BY char]
(集合分割符)
[MAP KEYS TERMINATED BY char]
(字典k-v分割符)[LINES TERMINATED BY char]
(行分割符)。Hive 通过此确定表的具体的列的数据STORED AS
指定存储文件类型LOCATION
:指定表在 HDFS 上的存储位置AS
:后跟查询语句,根据查询结果创建表LIKE
允许用户复制现有的表结构,但是不复制数据
4.1 案例实战
默认创建的表都是所谓的管理表,有时也被称为内部表。当我们删除一个管理表时,Hive 也会删除这个表中数据。管理表不适合和其他工具共享数据。
删除外部表并不会删除掉这份数据,不过描述表的元数据信息会被删除掉
- 普通创建表
create table if not exists student( id int, name string ) row format delimited fields terminated by '\t' stored as textfile location '/user/hive/warehouse/student';
- 根据查询结果创建表
create table if not exists student2 as select id, name from student;
- 根据已经存在的表结构创建表
create table if not exists student3 like student;
- 查询表的类型
desc formatted student2; Table Type: MANAGED_TABLE
- 创建外部表
create external table if not exists student4( id int, name string ) row format delimited fields terminated by '\t'
- 修改内部表为外部表
alter table student2 set tblproperties('EXTERNAL'='TRUE');
- 修改外部表为内部表
alter table student2 set tblproperties('EXTERNAL'='FALSE');
5. 修改表
5.1 重命名表
alter table dept rename to dept_1;
5.2 增加/修改/替换列信息
// 添加列
alter table dept_1 add columns (deptdesc string, deptcol int);
// 更新列
alter table dept_1 change column deptdesc desc string;
// 替换列
alter table dept_1 replace columns (deptno string, dname string);
ADD
是代表新增一字段, 字段位置在所有列后面, partition
列前
REPLACE
则是表示替换表中所有字段
6. 删除表
drop table dept_1;