1,DDL
1,数据库操作
1)建库
create database if not exists dbname;
if not exists 防止报错
2)切换库
use dbname;
3)查询正在使用的库
select current_database();
4)查询库列表
show databases;
show databases like "*test";
5)查询库的详细描述信息
desc database dbname;
6)删除数据库
drop database if exists dbname; 默认只能删除空数据库 数据库中没有表的
drop database dbname cascade; 级联删除 删除非空数据库的
drop database dbname;==drop database dbname restrict;
2,表操作
1)建表语句
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name
[(col_name data_type [COMMENT col_comment], ...)]
[COMMENT table_comment]
[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]
[CLUSTERED BY (col_name, col_name, ...)
[SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS]
[ROW FORMAT row_format]
[STORED AS file_format]
[LOCATION hdfs_path]
说明
1)external 外部表关键字 ,如果不加代表创建的是内部表
2)IF NOT EXISTS 防止报错,不存在才创建 ,存在不创建
删除表 if exists
3)COMMENT 指定字段或表的描述信息的
4)PARTITIONED BY(col_name data_type 分区字段) 指定分区表的分区字段的
注意: 分区字段一定不能再建表字段中 分区字段单独存储的
5)CLUSTERED BY (col_name, col_name, …)
[SORTED BY (col_name [ASC|DESC], …)] INTO num_buckets BUCKETS]
指定分桶的 CLUSTERED BY 分桶标志
INTO num_buckets BUCKETS] 分桶个数
SORTED BY 指定每一个桶中中的排序规则的
注意:分桶字段一定在建表字段 分桶字段一定是建表字段中的某一个 某几个
6)ROW FORMAT row_format 指定行格式化
指定字段分割符的
lines terminated by \n 行分割符
fields terminated by \001 字段分割符
7)STORED AS file_format 指定表数据的存储格式
默认 textfile的
SequenceFile 二进制
RCFile 行列结合的形式
8)LOCATION 指定存储位置的 不指定默认 /user/hive/warehouse
指定 则在指定目录下
案例
9527,周星星,男,50,FBI
(1)创建一个内部表
create table if not exists stu_managed(sid int,name string,sex string,age int,dept string) row format delimited fields terminated by ",";
(2)创建一个外部表
create external table if not exists stu_external(sid int,name string,sex string,age int,dept string) row format delimited fields terminated by ",";
(3)创建一个分区表
分区字段 dept
create table if not exists stu_ptn_dept(sid int,name string,sex string,age int) partitioned by (dept string) row format delimited fields terminated by "," location "/user/hivedata/stu_ptn";
(4)创建一个分桶表
create table if not exists stu_buk(sid int,name string,sex string,age int,dept string) clustered by (age) sorted by(sid) into 3 buckets row format delimited fields terminated by ",";
(5)表复制
仅仅复制表结构 不复制表数据 表属性
like
create table tbname like tbname1;
create external table stu_copy like stu_buk;
注意:表属性 取决于自己建表时候是否制定 external的
(6)ctas建表
create table tbname as select ....
将一个sql的查询结果存储在一个表中
create table tbname as select * from dbname1;
(7)查看表的详细信息
desc tbname;
desc extended tbname;查看表的扩展信息
desc extended stu_managed; 了解
desc formatted tbname; 格式化显示表的详细信息
desc formatted stu_managed;
2)显示表的描述信息
desc tbname;
desc formatted tbname;
3)删除表
drop tbname;
4)查看表列表
show tables;
show tables in dbname; 指定数据库下的所有表
show tables in test;
show