hadoop 之 Hive的使用_hadoophive怎么用-CSDN博客

本文链接：https://blog.csdn.net/qq_41521379/article/details/106058560

hive shell;
在这里插入图片描述

create [+ external] + table + ‘name of table’ +
create external table t_user(id int ,name string) row format delimited fields terminated by ',' lines terminated by '\n';
注：在进行表操作之前不指定数据库，会在默认default数据库中操作

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

① 创建person.txt 文件
② 导入数据到person表
- LOAD DATA LOCAL INPATH 'person.txt' OVERWRITE INTO TABLE person partition (dt='20170315');
- LOAD DATA LOCAL INPATH 'person.txt' OVERWRITE INTO TABLE person partition (dt='20200415');
- LOAD DATA LOCAL INPATH 'person.txt' OVERWRITE INTO TABLE person partition (dt='20200421');
③ 查看数据
- select * from person;
④ 分区查询
- select fav[0] from person where dt='20170315';
⑤不分区查询
- select fav[0] from person;

在这里插入图片描述

① 创建person.txt文件
② 导入数据
- LOAD DATA LOCAL INPATH 'person.txt' OVERWRITE INTO TABLE person1 PARTITION(dt='20200511')
③ 按桶查询
- select * from person1 tablesample(bucket 1 out of 4 on id);
④ 数据存放
- 原数据文件仍然以分区存在，不以桶的形式存在，其实分桶已经生效，查询效率大大提高。

概念：
- ①MANAGED_TABLE，默认是内部表（托管表）；②EXTERNAL_TABLE是外部表。
  ③在创建命令前加external 关键字就是外部表
区别
- ④内表删除表或者分区元数据和数据都删了；
  ⑤外表删除表元数据删除，数据保留。
  ⑥如果数据共享，其他应用也用，就用外部表；否则只是hive用，就用内部表。