-基于HDFS
-没有专门的数据存储格式
-存储结构主要包括:数据库、文件、表、视图
-可以直接加载文本文件(txt csv等)
-创建表时,指定Hive数据的列分隔符与行分隔符
表: 内部表 /分区表 /外部表 /桶表
-内部表:与数据库中的Tale在概念上类似;
每一个Table在hive中都有一个相应的目录存储数据;
所有的Table数据不包括外部表都保存在这个目录中;
删除表时, 元数据与数据都会被删除;
create table table_name ( , , ,) location '/mytable/hive/t2'; ----指定表文件保存目录
create table table_name ( , , ,) row format delimited fields terminated by ','; ----指定列与列之间的分隔符
-分区表:partition对应于数据库的partition列的密集索引
一个分区对应于表中的一个目录
所有的分区数据都存储在对应的目录中
-外部表:指向已经在HDFS中存在的数据,可以创建分区
只有一个过程,加载数据和创建表同时完成,并不会移动到数据仓库目录中,只是与外部数据建议一个链接,当删除外部表时,仅删除该链接
-桶表:对数据进行哈希取值