Hive知识点之分区表、让分区表和数据产生关联的三种方式、修改表、数据导入、数据导出、内部排序（Sort By）、分区排序（Distribute By）、Cluster By 、分桶及抽样查询

爱上口袋的天空

已于 2022-07-02 16:46:52 修改

阅读量216

点赞数

文章标签： hive

于 2019-08-25 17:09:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/K_520_W/article/details/100046439

版权

一：分区表

简介
创建分区表语法
加载数据到分区表中
查询分区表中数据
多分区联合查询
增加分区
⑴创建单个分区

⑵同时创建多个分区
查看分区表有多少分区
删除分区
a：删除单个分区

b：删除多个分区
创建二级分区表
导入数据

二：把数据直接上传到分区目录上，让分区表和数据产生关联的三种方式

方式一：上传数据后修复
⑴创建目录

⑵上传数据

⑶查询数据，发现刚刚上传的20190824没有数据

⑷执行修复命令：msck repair table dept_partition2;
方式二：上传数据后添加分区
⑴上传数据


⑵执行添加分区

⑶查询数据
方式三：上传数据后 load 数据到分区
⑴ 创建目录，上传数据

⑵查询数据

三：修改表

重命名表
增加/修改/替换列信息

四：数据导入

向表中装载数据（Load）
⑴语法：load data [local] inpath '/opt/module/datas/student.txt' [overwrite] into table student [partition (partcol1=val1,…)];

⑵实操案例
a：创建一张表

b：加载本地文件到 hive

c：上传文件到 HDFS ，加载 HDFS 上数据


d：加载数据覆盖表中已有的数据
通过查询语句向表中插入数据（Insert）

五：数据导出

将查询的结果格式化导出到本地
  命令：insert overwrite local directory '/opt/module/datas/export/student'
  row format delimited fields terminated by '\t' select * from student ;
将查询的结果导出到 HDFS 上(没有 local)
命令：insert overwrite directory '/user/kgf/student' row format delimited fields terminated by '\t' select * from student；
Hadoop 命令导出到本地
命令：dfs -get /user/hive/warehouse/dept_partition2/month=201907/day=23 /opt/module/datas/export/;
Hive Shell 命令导出
Export 导出到 HDFS 上
清除表中数据（Truncate）

六：每个 MapReduce 内部排序（Sort By）

七：分区排序（Distribute By）

八： Cluster By

九：分桶及抽样查询

分桶表数据存储简介
数据准备
创建分桶表

创建的表以id进行分区和排序，并且分为4桶。
数据通过子查询的方式导入到分桶表中（直接导入没有效果）
a：先建一个普通的 stu 表，向普通的 stu 表中导入数据


b：设置一个属性，打开分桶

c：通过子查询导入
命令：insert into table stu_buck select id,name from stu;
分桶抽样查询
数据块抽样

爱上口袋的天空

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hive知识点之分区表、让分区表和数据产生关联的三种方式、修改表、数据导入、数据导出、内部排序（Sort By）、分区排序（Distribute By）、Cluster By 、分桶及抽样查询

一：分区表简介创建分区表语法加载数据到分区表中查询分区表中数据多分区联合查询增加分区 ⑴创建单个分区 ⑵同时创建多个分区查看分区表有多少分区删除分区 a：删除单个分区 b：删除多个分区创建二级分区表......
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。