元数据存放位置
表的存放位置在 hive-site.xml
中指定
指定的就是 hive 中元数据的存放位置
<name>hive.metastore.warehouse.dir</name>
<value>/ser/hive/warehouse</value>
创建数据库
# 上一篇 003 写过的,你们自己看去吧
指定位置
create database myhive2 location '/myhive2'
修改数据库
alter database myhive2 set dbproperties(‘createtime’=‘20180611’)
只能修改数据库创建时间等信息,里面的元数据不能修改
数据库详细信息
desc database myhive2;
# 这个查看更多
desc database extended myhive2;
# 删除数据库;只能删除没表的数据
drop database myhive2;
# 强制删除数据库
drop database myhive cascade;
表
语法
# []:中括号表示这个关键字可有可无; EXTERNAL 表示创建外部表
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name
#
[(col_name data_type [COMMENT col_comment], ...)]
# 表注释,不能使用中文
[COMMENT table_comment]
# 创建表分区. 这里的分区不是 MR中的分区. 这里分的是文件夹,分几个区,就有几个文件夹
[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]
# 分桶,分文件,这里类似 MR中的分区
[CLUSTERED BY (col_name, col_name, ...)
# 实现排序
[SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS]
# 字段分隔符,将一个文件映射为一个表,但是文件中数据使用的是什么分隔符
[ROW FORMAT row_format] [STORED AS file_format]
# 表存储文件格式,类型
[STORED AS file_format]
# 创建表指定存储位置
[LOCATION hdfs_path]
说明
CREATE TABLE
创建表;分为内部表和外部表.
在创建的时候指向数据源.
但是在删除内部表的时候,会将数据一起删除
EXTRNAL
创建外部表
LIKE
复制表结构
ROW FORMAT DLIMITED
行的分隔符
STORED AS
文件数据类型.
SEWQUENCEFILE|TEXTFILE|RCFILE
PARITITIONED BY
分区.表分区.有多个. 可以看做是文件夹
SORTED BY
排序
ROW FORMAT
数据之间的分隔符
CLUSTERED BY
分桶
总结
分桶: 一个文件数据太大,将其按照数据特征划分为不同的文件存储
分区: 分桶太多了,就进行分区.
建表
use hive;
create table stu(id int,name string);
基操
insert into stu(1,"小明");
数据类型
建表
指定字段之间分隔符建表
create table if not exists stu2(id int,name string) row format delimited fields terminated by '\t' stored as textfile localtion '/usr/stu2';
这个表的数据,字段之间的分隔符是 \t,数据来源于 /usr/stu2 这个文件
根据查询结果建表
create table stu3 as select * from stu2
根据已存在的表结构创建表
create table stu4 like stu2;
查看表类型
desc formatted stu2;